Herramientas de IA aceleran la extracción de datos experimentales de artículos científicos para bases de datos de materiales

Found this article helpful?

Share it with your network and spread the knowledge!

Herramientas de IA aceleran la extracción de datos experimentales de artículos científicos para bases de datos de materiales

Los científicos de materiales que desarrollan nuevos materiales funcionales para tecnologías como teléfonos inteligentes y automóviles enfrentan desafíos significativos para predecir las propiedades de los materiales, ya que los modelos teóricos por sí solos no pueden proporcionar predicciones confiables debido a las complejas relaciones entre composición, métodos de síntesis y propiedades resultantes. Un equipo dirigido por la Dra. Yukari Katsura en el Instituto Nacional de Ciencia de Materiales de Japón ha desarrollado dos herramientas de inteligencia artificial que aceleran la construcción de Starrydata, una base de datos de propiedades de materiales construida a partir de datos recopilados de artículos científicos, con su trabajo publicado recientemente en la revista Science and Technology of Advanced Materials: Methods.

La investigación aborda un cuello de botella crítico en la ciencia de materiales: millones de artículos científicos contienen valiosos datos experimentales recopilados por investigadores anteriores, pero gran parte de esta información permanece sin explotar porque extraerla manualmente requiere mucho tiempo. El proyecto Starrydata, lanzado por la Dra. Katsura en 2015, inicialmente dependía de la recopilación manual de datos respaldada por el sistema web Starrydata2. Las nuevas herramientas de IA optimizan drásticamente este proceso al aprovechar modelos de lenguaje grandes como ChatGPT para extraer información sobre figuras, tablas y muestras de archivos PDF de artículos en diversos campos de la ciencia de materiales.

La primera herramienta, Starrydata Auto-Suggestion for Sample Information, ya está integrada en el sistema web Starrydata2 y funciona leyendo el texto del artículo y sugiriendo entradas candidatas para campos de datos predefinidos para cada dominio de materiales. Cuando los usuarios pegan texto del resumen o la sección de métodos experimentales de un artículo, el sistema lo envía al GPT de OpenAI a través de API y muestra automáticamente entradas candidatas en inglés debajo de cada campo de entrada. Esta herramienta ayuda a estandarizar la entrada de datos mientras reduce el tiempo que los investigadores dedican a extraer información manualmente.

La segunda herramienta, Starrydata Auto-Summary GPT, descompone archivos PDF completos de artículos de acceso abierto cargados por los usuarios y resume automáticamente todas las descripciones de figuras, tablas y muestras como datos estructurados en formato JSON. Generados utilizando la función GPT personalizada de ChatGPT, los datos resultantes pueden verse como tablas fáciles de leer en navegadores web. Aunque estos datos actualmente no se incorporan directamente a la base de datos Starrydata, aceleran drásticamente el trabajo de los recopiladores de datos para localizar rápidamente información objetivo e ingresarla sistemáticamente. El equipo señala que leer puntos de datos de imágenes de gráficos sigue siendo un desafío para los LLM, por lo que esta tarea la realizan los recopiladores de datos utilizando una herramienta semiautomatizada desarrollada independientemente.

La Dra. Katsura explicó la importancia de este enfoque: "Un artículo es una estructura lógica ensamblada para transmitir las afirmaciones del autor, pero al descomponerlo y devolverlo a la forma de datos experimentales, otros investigadores también pueden usarlo para su propia investigación". El equipo aspira a un futuro donde los datos experimentales de todos los campos de la ciencia de materiales puedan compartirse digitalmente y verse desde una perspectiva general, permitiendo a los investigadores obtener inspiración a través de descripciones generales integrales de datos y realizar predicciones de propiedades basadas en tendencias empíricas utilizando aprendizaje automático.

Actualmente, Starrydata ha avanzado en la construcción de bases de datos para campos específicos de la ciencia de materiales como materiales termoeléctricos que convierten calor y electricidad, e imanes. Como un conjunto de datos abierto utilizable para el desarrollo de nuevos materiales, está comenzando a ser utilizado por investigadores líderes en todo el mundo. La investigación del equipo tiene como objetivo crear mayor conciencia sobre el potencial de los datos experimentales a gran escala y establecer la recopilación de datos de artículos como una forma reconocida de investigación dentro de la comunidad científica. Las herramientas actualmente se dirigen a artículos de acceso abierto debido a las restricciones de los editores sobre el uso de inteligencia artificial con archivos PDF de artículos, con más detalles disponibles en su artículo publicado en https://doi.org/10.1080/27660400.2025.2590811.

Las implicaciones de esta investigación se extienden más allá de la ciencia de materiales, demostrando cómo la IA puede transformar la gestión de datos científicos en todas las disciplinas. Al automatizar la extracción de datos experimentales enterrados, los investigadores pueden construir bases de datos más completas que aceleren el descubrimiento y la innovación. Este enfoque eventualmente podría aplicarse a otros campos científicos donde datos valiosos permanecen bloqueados dentro de artículos publicados, revolucionando potencialmente cómo se organiza, accede y utiliza el conocimiento científico para futuros avances. La revista donde aparece esta investigación, Science and Technology of Advanced Materials: Methods, se centra en métodos y herramientas emergentes para mejorar el desarrollo de materiales, con más información disponible en https://www.tandfonline.com/STAM-M.

blockchain registration record for this content
La rédaction de Burstable.News

La rédaction de Burstable.News

@burstable

Burstable.News proporciona diariamente contenido de noticias seleccionado para publicaciones en línea y sitios web. Póngase en contacto con Burstable.News hoy mismo si le interesa añadir a su sitio web un flujo de contenido fresco que satisfaga las necesidades informativas de sus visitantes.