Estudios Científicos

Desarrollan técnicas a través de Inteligencia Artificial para ayudar a comunidad científica por COVID-19

Estados Unidos.-Investigadores y líderes del Instituto Allen para Inteligencia Artificial (IA), la Iniciativa Chan Zuckerberg (CZI), el Centro de Seguridad y Tecnología Emergente (CSET) de la Universidad de Georgetown, Microsoft y la Biblioteca Nacional de Medicina (NLM) en los Institutos Nacionales de Salud publicaron el COVID-19 Open Research Dataset (CORD-19) de literatura académica sobre COVID-19, SARS-CoV-2 y el grupo Coronavirus.

Solicitado por la Política de la Oficina de Ciencia y Tecnología de la Casa Blanca, el conjunto de datos representa la colección de literatura de Coronavirus más amplia disponible para la minería de datos y texto hasta la fecha, con más de 29,000 artículos, de los cuales más de 13,000 tienen texto completo.

Ahora, la Casa Blanca se une a estas instituciones para emitir un llamado a la acción a los expertos en inteligencia artificial de la nación para desarrollar nuevas técnicas de extracción de datos y texto que puedan ayudar a la comunidad científica a responder preguntas científicas de alta prioridad relacionadas con COVID-19.

La colección fue construida a través de una colaboración única entre Microsoft, NLM, CZI y el Instituto Allen para IA, coordinada por la Universidad de Georgetown. Las herramientas de curación de literatura a escala web de Microsoft se utilizaron para identificar y reunir esfuerzos y resultados científicos mundiales, CZI proporcionó acceso a contenido previo a la publicación, NLM proporcionó acceso a contenido de literatura y el equipo de Allen AI transformó el contenido en una forma legible por máquina, preparando el corpus para su análisis y estudio.

El recurso CORD-19 está disponible en el sitio web SemanticScholar.org del Instituto Allen y continuará actualizándose a medida que se publique una nueva investigación en servicios de archivo y publicaciones revisadas por pares. Los investigadores deben enviar el texto y las herramientas de minería de datos y los conocimientos que desarrollan en respuesta a este llamado a la acción a través de la plataforma Kaggle. A través de Kaggle, una comunidad de aprendizaje automático y ciencia de datos propiedad de Google Cloud, estas herramientas estarán disponibles de forma abierta para investigadores de todo el mundo.

“Una de las aplicaciones más inmediatas e impactantes de la IA es la capacidad de ayudar a los científicos, académicos y tecnólogos a encontrar la información correcta en un mar de documentos científicos para acelerar la investigación. Aplaudimos a OSTP, OMS, NIH y todas las organizaciones que están adoptando un enfoque proactivo para utilizar la tecnología más avanzada en la lucha contra COVID-19 ”, dijo el Dr. Oren Etzioni, Director Ejecutivo del Instituto Allen para IA. “El Instituto Allen para IA, y particularmente el equipo de Semantic Scholar, se compromete a actualizar y mejorar este importante recurso y los métodos asociados de IA que la comunidad utilizará para abordar este problema crucial”.

“Es difícil para las personas revisar manualmente más de 20,000 artículos y sintetizar sus hallazgos. Los avances recientes en tecnología pueden ser útiles aquí. Estamos presentando versiones legibles por máquina de estos artículos frente a nuestra comunidad de más de 4 millones de científicos de datos. Nuestra esperanza es que la IA se pueda utilizar para ayudar a encontrar respuestas a un conjunto clave de preguntas sobre COVID-19 ”, dijo Anthony Goldbloom, cofundador y director ejecutivo de Kaggle.

Extracto de La Casa Blanca de EE.UU.