In diesem Projekt wird untersucht, wie graphische neuronale Netze (GNNs) auf Quellcode vortrainiert werden können. Es handelt sich um ein übergreifendes Projekt, das aus mehreren Teilen besteht:
- Ein Tool zum Mining von Graphendarstellungen aus Quellcode in verschiedenen Sprachen.
- Implementierung von GNNs für verschiedene ML4SE-Aufgaben und Pre-Training-Ziele. Wir haben 8 GNN-Typen auf der Grundlage der PyTorch-Geometric-Bibliothek implementiert und evaluiert, um deren Skalierung zu berücksichtigen.
- Erstellung eines Frameworks/einer konfigurierbaren Pipeline zum bequemen Experimentieren mit ML4SE-Aufgaben. Das Framework ist bereits vorhanden.
- Vorschläge für neue Verbesserungen der GNN-Architektur und der Lernziele.