Paper-Analyzer

Paper-Analyzer vise à faciliter l’extraction des connaissances à partir d’articles scientifiques (biomédicaux) par l’intermédiaire de modèles d’apprentissage profond (DL) pour le traitement du langage naturel (NLP). Le noyau de Paper-Analyzer est un modèle de langage (LM) construit avec des architectures de type Transformer affinés sur des articles scientifiques. L’objectif du LM est de prédire le mot suivant, compte tenu du contexte. Nous avons formé des modèles construits sur le LM pour résoudre plusieurs tâches en aval comme la reconnaissance des entités nommées (NER), l’extraction des relations (RE) et la réponse aux questions (QA) comme étapes consécutives vers l’objectif principal, qui est l’extraction automatique des connaissances.

Nous avons mis en œuvre la NER et le RE sous la forme de classificateurs (qui attribuent diverses classes à des mots ou des tuples mot) et la QA sous forme extractive (où la réponse à une question est une plage de texte).

Nous expérimentons également des modèles génératifs pour la synthèse d'article et les tâches de paraphrase des phrases.

Projet

Paper-Analyzer est une application web qui exécute des requêtes de recherche sur une collection de 30 millions d'abstracts d'articles publiés sur PubMed

Membres du groupe

Denis Stepanov
Chef de laboratoire/groupe de recherche
Ashot Kazaryan
Développeur de logiciels
Aleksander Tarelkin
Développeur de logiciels
Evgeny Dedov
Développeur de logiciels
Daria Kuzmenko
Chercheuse
Galina Ryazanskaya
Chercheuse