Paper-Analyzer

Paper-Analyzer 旨在通过自然语言处理 (NLP) 的深度学习 (DL) 模型,促进从科学(生物医学)论文中提取知识。 Paper-Analyzer 的核心是一个语言模型 (LM),它是用类似于变压器的架构建立的,专门用于科学论文。 LM 的目标是根据上下文预测下一个词。我们培训了基于 LM 构建的模型,以解决多个下游任务,如命名实体识别 (NER)、关系提取 (RE) 和问题解答 (QA),作为实现主要目标(自动知识提取)的连续步骤。

我们以分类器的形式实现了 NER 和 RE(将各种类别分配给单词或单词元组),并以提取的形式实现了 QA(其中问题的答案是一个文本跨度)。

我们还试验了论文总结和句子转述任务的生成模型。

项目

Paper-Analyzer 是一个基于网络的应用程序,对 3000 万份PubMed 论文摘要的集合进行搜索查询

小组成员

Denis Stepanov
研究实验室/小组负责人
Aleksander Tarelkin
软件开发者
Evgeny Dedov
软件开发者
Daria Kuzmenko
研究员
Kacper Ogórek
研究员
Galina Ryazanskaya
研究员