データソース

特定の国の開発者数を推定する場合、国際労働機関(Eurostat など)からデータを収集し、その特定の国の国家統計(例: カナダの場合は Statistics Canada)を利用しています。「プログラマー」の定義は国によって異なるため、調査の目的に最も関連性の高いデータを収集しています。たとえば米国の場合、以下の専門職が「プログラマー」の定義と厳密に一致しています。

  • 15-1131 コンピュータープログラマー
  • 15-1132 ソフトウェア開発者、アプリケーション
  • 15-1133 ソフトウェア開発者、システムソフトウェア
  • 15-1134 ウェブ開発者

毎年世界中の 30,000 人の開発者に調査への協力を募り、年次開発者エコシステムアンケートを実施しています。このデータは当社の調査モデルを構築するのに役立ってきました。このデータにより、人気のプログラミング言語、ツール、テクノロジー、開発者の好み、新しいトレンドなど、開発者コミュニティを包括的に理解することが可能になっています。

モデル

モデルの構築にはある年(T)の特定の国(X)における人口規模と開発者数を使用しています。対象国の最近の公開データを使用して計算に使用できる最新情報を含む年を特定し、その特定の年の対象国の開発者の密度を算出しています。

DevDensity = DevNumber/Population

対象国の最近の年(T+1、T+2 など)の開発者数を算出するため、国連の推計に従って密度が一定であると仮定し、それを国の最近の人口に適用しています。これはレトロスペクティブ分析に基づいて効果的であることが実証されたモデルです。データが欠損している国の開発者数を算出する場合、同じ地域の他の国(「Y」とする)のデータを使用しています。それぞれの国 Yᵢ について既知のすべての年にわたる平均密度を算出し、結果の平均値の中から 10% の分位点を選択しています。これにより、国 X の開発者の密度が概算されます。

大まかな開発者の人口密度を算出したら、そのコミュニティにおける特定のカテゴリの開発者の規模を求めることができます。「開発者エコシステムの現状」アンケートデータからサンプル内の対象カテゴリの割合はわかっているため(全プログラマーのうち Python を使用しているプログラマーなど)、この特定のカテゴリの規模を以下のように算出できます。

CategorySize = CategoryShare х DevPopulation

2023 年に米国で Python を使用している開発者の数を推定するとしましょう。

「2023 年開発者エコシステムの現状」のデータがあるため、以下の質問に対する回答を使用できます。

  • どちらの国または地域にお住まいですか?
  • 過去 12 か月間にどのようなプログラミング言語を使用しましたか?

国または地域で「米国」と回答した全回答者から、Python を使用している米国の開発者の割合が「Python」をプログラミング言語として回答した回答者の重み付き割合として推定されます。

すると、2023 年に米国で Python を使用している開発者数の推定値を以下のように算出できます。

SizeUsaPython = ShareUsaPython х DevPopulationUSA

制限

この実施方法にはいくつかの制限があります。

このモデルは現在、プロ開発者のみを考慮しています。このデータや実施方法は学生やホビイストを考慮するには不十分であるため、このような個人は含まれていません。

特定の年の情報が欠落している場合は利用可能な最近のデータを使用しています。一部の国ではデータが欠落しているため、データを置換またはクリーニングする必要があります。

このダッシュボードのフィルターオプションは限定されており、包括的なデータのあるオプションのみが含まれています。

この数値は最も可能性の高い値(平均予測)のみを反映しているため、正確な値としてみなされるべきではありません。モデルのレトロスペクティブテストに基づくと、実際の値には予測値から平均して 14% のずれがあります(平均絶対パーセント誤差メトリック)。これにより、ダッシュボードに表示される予測から実際の値がどの程度ずれる可能性があるかを把握できます。

給与計算ツール

この給与計算ツールは、年次開発者エコシステムアンケートから収集されたデータに基づいています。給与データは米ドル建ての賞与などを除く年間手取り額(税引後)を回答者に尋ねて取得されたデータです。

この給与計算ツールの手法にはいくつかの制限があります。

  • 回答者は具体的な給与額ではなく、給与額の範囲の形式で給与情報を提供するように求められました。そのため、給与計算ツールはその範囲内での推定を提供するに過ぎず、正確な推定を提供できない可能性があります。
  • 給与に影響する要因は役職によって異なる可能性があります。さまざまな役職(デザイナー、プロジェクトマネージャー、プロダクトマネージャーなど)の個人から回答を得ましたが、回答数はこれらの役職の正確な給与を推定するには不十分です。したがって、給与計算ツールはコーディングを専門職とする人(正社員としてのコーディング業務経験を持つ回答者)を対象とする推定のみを提示しています。
  • 特定の年の情報が欠落している場合は利用可能な最近のデータを使用しています。
  • 給与計算ツールでは国と言語のフィルターオプションが限定されています。代表的なアンケートデータしかないオプションもあるためです。たとえば、オーストリアについては正確な推定を提供するのに十分なデータ点がないため、国のリストにオーストリアは含まれていません。