이 프로젝트는 그래프 신경망(GNN)이 소스 코드에서 사전 훈련될 수 있는 방법을 연구합니다.이 프로젝트는 여러 부분으로 구성된 우산 프로젝트입니다:
- 다른 언어로 된 소스 코드에서 그래프 표현을 마이닝하기 위한 도구.
- 다양한 ML4SE 작업 및 사전 훈련 목표를 위한 GNN 구현.확장성을 염두에 두고 PyTorch-Geometric 라이브러리를 기반으로 8가지 유형의 GNN을 구현하고 평가했습니다.
- ML4SE 작업으로 편리한 실험을 수행하기 위한 프레임워크/구성 가능한 파이프라인 구축.프레임워크는 이미 사용 가능합니다.
- GNN 아키텍처 및 훈련 목표에 대한 새로운 개선 사항 제안.