このプロジェクトでは、グラフニューラルネットワーク (GNNs) をソースコードで事前トレーニングする方法について調査します。複数の部分からなる包括的なプロジェクトです。
- 異なる言語のソースコードからグラフ表現をマイニングするためのツール。
- さまざまな ML4SE タスクおよび事前トレーニング目標のための GNN の実装。スケーリングを念頭に、PyTorch-Geometric ライブラリに基づいて 8 つのタイプの GNN を実装および評価しました。
- ML4SE タスクでの便利な実験のためにフレームワーク/構成可能なパイプラインを構築。フレームワークはすでに使用可能です。
- GNNアーキテクチャとトレーニング目標に対して新しい改善を提案。