Machine Learning-Methoden im Software Engineering

Large-scale pre-training of graph neural networks for ML4SE tasks

In diesem Projekt wird untersucht, wie graphische neuronale Netze (GNNs) auf Quellcode vortrainiert werden können. Es handelt sich um ein übergreifendes Projekt, das aus mehreren Teilen besteht:

  • Ein Tool zum Mining von Graphendarstellungen aus Quellcode in verschiedenen Sprachen.
  • Implementierung von GNNs für verschiedene ML4SE-Aufgaben und Pre-Training-Ziele. Wir haben 8 GNN-Typen auf der Grundlage der PyTorch-Geometric-Bibliothek implementiert und evaluiert, um deren Skalierung zu berücksichtigen.
  • Erstellung eines Frameworks/einer konfigurierbaren Pipeline zum bequemen Experimentieren mit ML4SE-Aufgaben. Das Framework ist bereits vorhanden.
  • Vorschläge für neue Verbesserungen der GNN-Architektur und der Lernziele.

Teilnehmende

Egor Bogomolov
Olga Petrova
Mikhail Evtikheev