Sources de données

Pour estimer le nombre de développeurs dans un pays donné, nous collectons des données auprès d'organisations internationales du travail (comme Eurostat) et utilisons les statistiques nationales de ce pays spécifique (par exemple Statistics Canada pour le Canada). Étant donné que les pays adoptent des définitions différentes du terme « programmeur », nous collectons les données les plus pertinentes pour les besoins de notre étude. Par exemple, aux États-Unis, les professions suivantes correspondent étroitement à la définition de « programmeur » :

  • 15-1131 Programmeurs informatiques
  • 15-1132 Développeurs de logiciels, applications
  • 15-1133 Développeurs de logiciels, logiciels systèmes
  • 15-1134 Développeurs web

Nous enquêtons chaque année sur l'écosystème des développeurs et sommes dans ce cadre amenés à contacter 30 000 personnes dans le monde. Ces données ont joué un rôle déterminant dans la construction de notre modèle d'étude. Elles nous permettent d'avoir une compréhension complète de la communauté des développeurs, avec notamment des informations sur les langages de programmation, outils et technologies populaires, les préférences des développeurs et les tendances émergentes.

Notre modèle

Nous nous appuyons sur la taille de la population et le nombre de développeurs dans un pays spécifique (X) au cours d'une année donnée (T) pour élaborer notre modèle. Nous utilisons les dernières données du pays accessibles au public pour identifier l'année avec les informations les plus récentes pour nos calculs. Cela nous permet de calculer la densité de développeurs dans ce pays pour cette année-là.

DevDensity = DevNumber/Population

Pour calculer le nombre de développeurs pour les années les plus récentes (T+1, T+2, …) pour un pays donné, nous supposons que la densité est constante et l'appliquons aux chiffres de population récents du pays, selon les estimations des Nations Unies. Ce modèle s'est avéré efficace d'après une analyse rétrospective. Pour calculer le nombre de développeurs dans un pays pour lequel on manque de données, nous utilisons les données d'autres pays de la même région (représentés par « Y »). Pour chaque pays Yᵢ, nous calculons la densité moyenne sur toutes les années connues. Nous choisissons ensuite un quantile de 10 % parmi les valeurs moyennes résultantes. Cela se rapprochera de la densité de développeurs dans le pays X.

Après avoir calculé la densité de la population générale des développeurs, nous pouvons déterminer la taille d'une catégorie particulière au sein de cette communauté. Connaissant la part de la catégorie qui nous intéresse dans l'échantillon à partir des données de l'enquête sur l'état de l'écosystème des développeurs (par exemple, les personnes utilisant Python parmi tous les programmeurs), nous pouvons calculer la taille de cette catégorie spécifique comme suit :

CategorySize = CategoryShare х DevPopulation

Supposons que nous souhaitions estimer le nombre de développeurs utilisant Python aux États-Unis en 2023.

Nous disposons des données de l'état de l'écosystème des développeurs 2023 et pouvons nous appuyer sur les réponses aux questions suivantes de l'enquête :

  • Dans quel pays / quelle région vivez-vous ?
  • Quels langages de programmation avez-vous utilisés au cours des 12 derniers mois ?

Parmi tous les participants ayant indiqué « États-Unis » comme leur pays ou région, la part des développeurs des États-Unis utilisant Python serait estimée comme la part pondérée des participants ayant répondu « Python » comme langage de programmation.

L'estimation du nombre de développeurs utilisant Python aux USA en 2023 peut alors être calculée comme suit :

SizeUsaPython = ShareUsaPython х DevPopulationUSA

Ses limites

Notre méthodologie comporte plusieurs limites :

Notre modèle ne prend actuellement en compte que les développeurs professionnels. Nous n'incluons pas les étudiants ou les amateurs, car nos données et notre méthodologie ne nous permettent pas de comptabiliser ces personnes.

En l'absence d'informations pour une année spécifique, nous utilisons les données disponibles les plus récentes. Pour certains pays, les données manquent et doivent être remplacées ou nettoyées.

Notre tableau de bord dispose d'options de filtrage limitées et inclut uniquement les options pour lesquelles nous disposons de données complètes.

Les chiffres reflètent uniquement la valeur la plus probable (prévision moyenne) et ne doivent pas être traités comme une valeur exacte. D'après les tests rétrospectifs du modèle, les valeurs réelles s'écartent en moyenne de 14 % des valeurs prévues (Métrique MAPE). Cela nous donne une idée de l'écart entre les vraies valeurs et les prévisions affichées sur le tableau de bord.

Calculateur des salaires

Notre calculateur de salaires s'appuie sur les données recueillies lors de notre enquête annuelle sur l'écosystème des développeurs. Les données salariales ont été obtenues en demandant aux participants à l'enquête leur salaire annuel net (après impôts) en USD, hors primes.

Notre méthodologie de calcul des salaires comporte plusieurs limites :

  • Les personnes interrogées sont invitées à fournir leurs informations de salaire en indiquant une fourchette de salaire plutôt qu'un montant spécifique. Le calculateur de salaires ne peut donc fournir que des estimations de fourchettes et non des estimations précises.
  • Les facteurs qui influencent un salaire dépendent du poste occupé. Bien que nous ayons reçu des réponses de personnes occupant une multitude de postes (concepteurs, chefs de projet, chefs de produit, etc.), le nombre de ces réponses est insuffisant pour fournir des estimations salariales précises pour ces postes. Par conséquent, le calculateur de salaires affiche uniquement les estimations pour les professionnels du codage (participants employés à temps plein et ayant une expérience professionnelle en codage).
  • En l'absence d'informations pour une année spécifique, nous utilisons les données disponibles les plus récentes.
  • Le calculateur de salaires propose des options de filtrage limitées pour les pays et les langages de programmation, car nous ne disposons que de données d'enquête représentatives pour ces options. Par exemple, la liste des pays n'inclut pas l'Autriche car nos données ne permettent pas de fournir des estimations précises.