Desde el Ontology Engineering Group de la Escuela Técnica Superior de Ingenieros Informáticos de la Universidad Politécnica de Madrid lanzan esta iniciativa abierta para intentar dar a la comunidad científica y médica respuestas a algunas de sus preguntas a partir del análisis de la literatura científica que se ha publicado sobre el COVID-19.
Desde hace unas semanas, el Allen Institute for Artificial Intelligence mantiene un corpus actualizado de artículos científicos sobre COVID-19. A fecha de 27 de marzo de 2020, este corpus contiene más de 44.000 artículos en inglés, con el texto completo de más de 29.000 artículos.
Esta ingente cantidad de literatura científica que se ha generado en apenas unos meses desde la aparición del virus, demuestra la gran actividad científica para su estudio. Pero al mismo tiempo, este corpus es tan grande que se ha convertido en un problema para que científicos y médicos puedan encontrar información específica sobre algún tipo de tratamiento que se haya probado en algún grupo específico de la población, relaciones entre tratamientos, resultados obtenidos, etc. Esto es lo que normalmente se conoce como sobrecarga de información.
El 16 de marzo del 2020, la Oficina de Política Científica y Tecnológica de la Casa Blanca realizó un llamamiento a la comunidad internacional de Inteligencia Artificial para el desarrollo de técnicas de procesamiento de lenguaje natural y minería de textos que ayudaran a resolver preguntas que la comunidad científica se está realizando sobre el COVID-19. Muchas de estas preguntas, formuladas por médicos y científicos, están recogidas en la plataforma Kaggle, bien conocida por la comunidad de Ciencia de Datos e Inteligencia Artificial. A fecha de 27 de marzo, hay ya más de 400 iniciativas y contribuciones registradas, donde se han hecho distintos tipos de tratamientos de los textos que han sido proporcionados para responder a distintos grupos de preguntas.
En el Ontology Engineering Group de la Escuela Técnica Superior de Ingenieros Informáticos de la Universidad Politécnica de Madrid llevan trabajando varios años en el procesamiento de grandes corpus de textos, así que desde la semana pasada se han puesto a trabajar para intentar aportar su grano de arena en la solución de estos problemas, desarrollando el core de una tecnología que permita a otros investigadores, estudiantes e informáticos trabajar sobre ella. En la siguiente página describen lo que han hecho hasta ahora, y los recursos que ponen a disposición del resto de la comunidad científica, por si pudieran resultar útiles: https://oeg-upm.github.io/covid19/
Asimismo, hacen un llamamiento a todos aquellos que queráis colaborar en esta iniciativa abierta a toda la comunidad española en Inteligencia Artificial (investigadores, desarrolladores, estudiantes) con nuevas preguntas, con nuevos algoritmos que resuelvan algunas de las preguntas que la comunidad científica y médica se está realizando, con la validación de los resultados que han obtenido hasta ahora, con herramientas de visualización más amigable para los médicos, o con cualquier otra cosa que se os ocurra. Juntos podemos construir una plataforma con un conjunto de herramientas que puedan ser útiles para todos.
No dudéis en contactarles a través del repositorio https://github.com/librairy/covid19 (para desarrolladores) o directamente a su dirección de correo (mailto:oeg-covid19@delicias.dia.fi.upm.es).
¿Podemos interrelacionar diagnósticos, patologías y síntomas con principios activos y grupos terapéuticos a partir de la literatura científica?
Esta es la pregunta de Kaggle que han seleccionado y con la que han comenzado a trabajar. Tratan de ofrecer herramientas informáticas a la comunidad científica y a los responsables de la gestión de la epidemia. Estas herramientas les permitirán navegar por el corpus de textos en inglés para poder entender mejor qué tipos de tratamientos exitosos y fallidos se han probado, según lo reportado en la documentación científica. De esta forma, podrán entender mejor qué combinaciones de principios activos han sido probados, lo que podría servir, por ejemplo, para definir nuevos protocolos clínicos de tratamiento para pacientes con algunas condiciones específicas.
Las herramientas y servicios que han construido, con licencias de código abierto, son la base sobre la que esperan que este tipo de preguntas se puedan resolver. Aún queda mucho trabajo por hacer, sobre todo para proporcionar herramientas más cercanas a los usuarios finales. Por el momento, se han centrado en proporcionar las bases que otros desarrolladores también pueden utilizar para poder partir de un corpus ya refinado y anotado.
Hola , soy antiguo alumno de la Facultad de Informática – UPM, y ahora estoy trabajando en USA.
Mi empresa Esri en colaboración con la WHO y la Universidad Johns Hopkins University (JHU) han puesto en marcha una serie de donaciones e iniciativas para para combatir el COVID-19.
– Repositorio Github -JHU> https://github.com/CSSEGISandData/COVID-19
– COVID- 19 HUB de datos USA -> https://coronavirus-resources.esri.com/
– Repositorio en España -> https://covid19esrispain-sitesesrispain.hub.arcgis.com/
Ahora hay varias iniciativas en marcha para reutilizar los datos, y realizar análisis espaciales.
Creo que en este momento podría ser de interés una colaboración con la UPM.
Quedo a la espera de su respuesta
Muchas gracias
Pedro Torres
Hola Pedro, por favor, contacta con nosotros por correo electrónico y hablamos. ¡Muchas gracias!