O Paper-Analyzer visa facilitar a extração de conhecimento de artigos científicos (biomédicos) através de modelos de Deep Learning (DL) para Processamento de Linguagem Natural (PNL). O núcleo do Paper-Analyzer é um Modelo de Linguagem (LM) desenvolvido com arquiteturas semelhantes ao Transformer adaptadas a artigos científicos. O objetivo do LM é prever a próxima palavra com base em um contexto. Treinamos modelos construídos no LM para resolver várias tarefas, como Reconhecimento de Entidades Nomeadas (NER), Extração de Relações (RE) e Resposta a Perguntas (QA) como etapas consecutivas para o objetivo principal, que é a extração automática de conhecimento
Implementamos o NER e a RE na forma de classificadores (que atribuem várias classes a palavras ou tuplas de palavras) e a QA na forma extrativa (onde a resposta a uma pergunta é um espaço de texto)..
Também fazemos experimentos com modelos generativos para tarefas de resumo de artigos e parafraseamento de frases.
O Paper-Analyzer é um aplicativo baseado na Web que faz buscas em um repositório de 30 milhões de resumos de artigos no PubMed