Ce projet a pour objectif de comprendre comment évaluer correctement les modèles de génération de code, comparer les métriques de performances existantes et introduire une nouvelle unité de mesure offrant une meilleure corrélation avec le jugement humain.