JetBrains logo

データソース

特定の国の開発者数を推定する場合、国際労働機関(Eurostat など)からデータを収集し、その特定の国の国家統計(例: カナダの場合は Statistics Canada)を利用しています。「プログラマー」や「開発者」などの定義は国によって異なるため、調査の目的に最も関連性の高いデータを収集しています。たとえば米国の場合、以下の専門職が「プログラマー」の定義と厳密に一致しています。

  • 15-1131 コンピュータープログラマー
  • 15-1132 ソフトウェア開発者、アプリケーション
  • 15-1133 ソフトウェア開発者、システムソフトウェア
  • 15-1134 ウェブ開発者
  • 15-1242 データベース管理者
  • 15-1243 データベースアーキテクト
  • 15-1253 ソフトウェア品質保証アナリストおよびテスター
  • 15-2031 オペレーションズリサーチアナリスト
  • 15-2041 統計家
  • 15-2051 データサイエンティスト

毎年世界中の 30,000 人の開発者に調査への協力を募り、年次開発者エコシステムアンケートを実施しています。このデータは当社の調査モデルを構築するのに役立ってきました。このデータにより、人気のプログラミング言語、ツール、テクノロジー、開発者の好み、新しいトレンドなど、開発者コミュニティを包括的に理解することが可能になっています。

モデル

モデルの構築にはある年(T)の特定の国(X)における人口規模と開発者数を使用しています。対象国の最近の公開データを使用して計算に使用できる最新情報を含む年を特定し、その特定の年の対象国の開発者の密度を算出しています。

DevDensity = DevNumber/Population

特定の国(X)における数年後(T+1、T+2、…)の開発者数を算出するため、密度は線形トレンドを追っているか、直近のデータポイントが古い場合には一定のままであると仮定します。 次に、この密度は国連が推定した国の直近の人口数に適用されます。これはレトロスペクティブ分析に基づいて効果的であることが実証されたモデルです。

データが欠損している国の開発者数を算出する場合、同じ地域の他の国(「Y」とする)のデータを使用しています。それぞれの国 Yᵢ について同じ年の平均密度を算出し、結果の平均値の中から 10% の分位点を選択しています。これにより、国 X の開発者の密度が概算されます。

大まかな開発者の人口を算出したら、そのコミュニティにおける特定のカテゴリの開発者の規模を求めることができます。開発者エコシステムアンケートのデータからサンプル内の対象カテゴリの割合は分かっているため(全プログラマーのうち Python を使用しているプログラマーの割合など)、この特定のカテゴリの規模を以下のように算出できます。

CategorySize = CategoryShare х DevPopulation

2024 年に米国で Python を使用している開発者の数を推定するとしましょう。

「2024 年開発者エコシステムの現状」のデータがあるため、以下の質問に対する回答を使用できます。

  • どちらの国または地域にお住まいですか?
  • 過去 12 か月間にどのようなプログラミング言語を使用しましたか?

国または地域で「米国」と指定した全回答者から、Python を使用している米国の開発者の割合が「Python」をプログラミング言語として指定した回答者の重み付き割合として推定されます。

すると、2024 年に米国で Python を使用している開発者数の推定値を以下のように算出できます。

SizeUsaPython = ShareUsaPython х DevPopulationUSA

制限

この実施方法にはいくつかの制限があります。

このモデルは現在、プロ開発者のみを考慮しています。このデータや実施方法は学生やホビイストを考慮するには不十分であるため、このような個人は含まれていません。

特定の年の情報が欠落している場合は利用可能な最近のデータを使用しています。一部の国ではデータが欠落しているため、データを置換またはクリーニングする必要があります。

このダッシュボードのフィルターオプションは限定されており、包括的なデータのあるオプションのみが含まれています。

この数値は最も可能性の高い値(平均予測)のみを反映しているため、正確な値としてみなされるべきではありません。モデルのレトロスペクティブテストに基づくと、実際の値には予測値から平均して 14% のずれがあります(平均絶対パーセント誤差メトリック)。これにより、ダッシュボードに表示される予測から実際の値がどの程度ずれる可能性があるかを把握できます。

給与計算ツール

この給与計算ツールは、年次開発者エコシステムアンケートから収集されたデータに基づいています。給与データは、回答者にボーナスを含む総収入(税引き前)の入力を求めて収集されたものです。この金額はその後、米ドルによる年間総給与に変換されました。

この給与計算ツールの手法にはいくつかの制限があります。

  • 給与に影響する要因は役職によって異なる可能性があります。さまざまな役職(デザイナー、プロジェクトマネージャー、プロダクトマネージャーなど)の個人から回答を得ましたが、回答数はこれらの役職の正確な給与を推定するには不十分です。したがって、給与計算ツールはコーディングを専門職とする人(正社員としてのコーディング業務経験を持つ回答者)を対象とする推定のみを提示しています。
  • 給与計算ツールでは国と言語のフィルターオプションが限定されています。代表的なアンケートデータしかないオプションもあるためです。たとえば、オーストリアについては正確な推定を提供するのに十分なデータ点がないため、国のリストにオーストリアは含まれていません。