Paper-Analyzer は、自然言語処理(NLP)向けのディープラーニング(DL)モデルを介して科学(生物医学)論文から知識を抽出しやすくすることを目的としています。 Paper-Analyzer の中核は、科学論文に合わせて調整されたトランスフォーマーのようなアーキテクチャで構築された言語モデル(LM)です。 LMの目的は、あるコンテキストにおいて、次の語を予測することです。LMの上に構築されたモデルをトレーニングし、自動知識抽出という主要目標を達成するための通過する手順として、名前付きエンティティ認識(NER)、関係抽出(RE)、および質問応答(QA)などの下流タスクをいくつか解決しました。
NERとREを分類子(単語または単語のタプルにさまざまなクラスを割り当てる)と抽出形式のQA(質問への回答はテキスト範囲)で実装しました。
論文の要約や文の言い換え作業の生成モデルについても実験しています。
Paper-Analyzer は、3000 万件の PubMed 抄録コレクションに対して検索クエリを実行するウェブベースのアプリケーションです。