Métodos de Machine Learning em Engenharia de Software

Large-scale pre-training of graph neural networks for ML4SE tasks

Este projeto estuda como redes neurais de grafos (GNNs) podem ser pré-treinadas no código-fonte. É um projeto abrangente que consiste de várias partes:

  • Uma ferramenta para a mineração de representações de grafos a partir do código-fonte em diferentes linguagens.
  • Implementação de GNNs para várias tarefas em aprendizado de máquina para engenharia de software e objetivos de pré-treinamento. Implementamos e avaliamos 8 tipos de GNNs, baseando-nos na biblioteca PyTorch-Geometric e tendo em mente sua escalabilidade.
  • Desenvolver um framework ou pipeline configurável para a experimentação conveniente com tarefas de aprendizado de máquina para engenharia de software. O framework já está disponível.
  • Sugerir novas melhorias à arquitetura de GNN e aos objetivos do treinamento.

Participantes

Egor Bogomolov
Olga Petrova
Mikhail Evtikheev