Paper-Analyzer tiene como objetivo facilitar la extracción de conocimientos de artículos científicos (biomédicos) a través de modelos de Deep Learning (DL) para el procesamiento del lenguaje natural (NLP). El núcleo de Paper-Analyzer es un modelo de lenguaje (LM) construido con arquitecturas similares a las de Transformer, específicas para artículos científicos. El objetivo del LM es predecir la siguiente palabra en función del contexto. Hemos entrenado modelos construidos sobre LM para resolver varias tareas posteriores, como el reconocimiento de entidades con nombre (NER), la extracción de relación (RE) y las respuestas a preguntas (QA) como pasos consecutivos al objetivo principal, que es la extracción automática de conocimientos.
Implementamos el NER y la RE en forma de clasificadores (que asignan varias clases a palabras o tuplas de palabras), y QA en forma de extracción (donde la respuesta a una pregunta es un intervalo de texto).
También experimentamos con modelos generativos para el resumen de artículos y el parafraseo de oraciones.
Paper-Analyzer es una aplicación web que realiza consultas de búsqueda en una colección de 30 millones de resúmenes de artículos de PubMed