JetBrains logo

Fontes de dados

Para estimar o número de desenvolvedores em um determinado país, reunimos dados de organizações trabalhistas internacionais (como a Eurostat) e usamos estatísticas nacionais daquele país (por exemplo, usamos a Statistics Canada para o Canadá). Como países diferentes têm definições diferentes para os termos “programador”, “desenvolvedores” etc., coletamos os dados mais relevantes para o objetivo do nosso estudo. Por exemplo, nos EUA, as seguintes profissões se encaixam relativamente bem na definição de "programador":

  • 15-1131 Programadores de Computador
  • 15-1132 Desenvolvedores de Software, Aplicativos
  • 15-1133 Desenvolvedores de Software, Sistemas
  • 15-1134 Desenvolvedores para a Web
  • 15-1242 Administradores de banco de dados
  • 15-1243 Arquitetos de banco de dados
  • 15-1253 Analistas e testadores de garantia de qualidade de software
  • 15-2031 Analistas de pesquisa operacional
  • 15-2041 Estatísticos
  • 15-2051 Cientistas de dados

Todos os anos, realizamos uma pesquisa sobre o Ecossistema dos Desenvolvedores, na qual procuramos 30.000 desenvolvedores em todo o mundo. Esses dados têm sido instrumentais para montarmos nosso modelo de pesquisa. Eles nos permitem obter uma compreensão abrangente da comunidade dos desenvolvedores, incluindo insights sobre linguagens de programação, ferramentas e tecnologias populares, preferências dos desenvolvedores e tendências emergentes.

Nosso modelo

Nós nos baseamos no tamanho da população e no número de desenvolvedores (X) em um país específico em um determinado ano (T) para montar nosso modelo. Usamos os últimos dados acessíveis publicamente de cada país para identificar o ano com as informações mais atualizadas para nossos cálculos. Isso nos permite calcular a densidade de desenvolvedores naquele país, naquele ano específico.

DevDensity = DevNumber/Population

Para calcular o número de desenvolvedores em anos futuros (T+1, T+2, ...) para um determinado país (X), presumimos que a densidade segue uma tendência linear ou permanece constante se o ponto de dados mais recente estiver desatualizado. Essa densidade é então aplicada ao número mais recente da população do país, de acordo com as estimativas das Nações Unidas. Com base em uma análise retrospectiva, esse modelo demonstrou ser eficaz.

Para calcular o número de desenvolvedores em um país sobre o qual faltam dados, usamos dados de outros países da mesma região (representados por "Y"). Para cada país Yᵢ, calculamos a densidade média no mesmo ano. Então, escolhemos um quantil de 10% dentre as médias resultantes. Isso dá a densidade aproximada de desenvolvedores no país X.

Depois de calcular a população geral de desenvolvedores, podemos calcular o tamanho de uma categoria específica de desenvolvedores dentro dessa comunidade. Conhecendo a parcela da categoria de interesse na amostra dos dados da pesquisa sobre o Estado do Ecossistema dos Desenvolvedores (por exemplo, programadores que usam Python dentre todos os programadores), podemos calcular o tamanho dessa categoria específica da seguinte forma:

CategorySize = CategoryShare х DevPopulation

Vamos presumir que queiramos estimar o número de desenvolvedores que usam Python nos EUA em 2024.

Temos os dados do Estado do Ecossistema dos Desenvolvedores em 2024 e podemos usar as respostas às seguintes perguntas da pesquisa:

  • Qual é o seu país ou região?
  • Quais linguagens de programação você utilizou nos últimos 12 meses?

De todos os participantes que responderam "Estados Unidos" como sendo seu país ou região, a parcela dos desenvolvedores dos EUA que usam Python seria estimada como sendo a parcela ponderada dos participantes que responderam "Python" como sua linguagem de programação.

Então, a estimativa do número de desenvolvedores que usam Python nos EUA em 2024 pode ser calculada da seguinte forma:

SizeUsaPython = ShareUsaPython х DevPopulationUSA

Limitações

Nossa metodologia tem várias limitações:

Atualmente, nosso modelo considera apenas desenvolvedores profissionais. Não incluímos estudantes ou programadores por hobby, porque nossos dados e nossa metodologia não são suficientes para incluirmos essas pessoas.

Quando faltam dados de um ano específico, usamos os dados mais recentes disponíveis. Faltam dados de alguns países e esses dados têm que ser substituídos ou limpos.

Nosso painel tem opções limitadas de filtragem e inclui apenas aquelas opções sobre as quais temos dados abrangentes.

Os dados refletem apenas o valor mais provável (previsão média) e não devem ser considerados valores exatos. Com base em testes retrospectivos do modelo, os valores reais desviam-se dos previstos por uma média de 14% (métrica MAPE). Isso nos dá uma ideia do quanto os valores verdadeiros podem se desviar das previsões mostradas no painel.

Calculadora de salários

Nossa calculadora de salários baseia-se nos dados reunidos na nossa pesquisa anual sobre o Ecossistema dos Desenvolvedores. Os dados sobre salários foram coletados pedindo aos entrevistados que informassem sua renda bruta (antes dos impostos), incluindo bônus. Os valores foram então convertidos em salários brutos anuais em dólares americanos.

A metodologia da nossa calculadora de salários tem várias limitações:

  • Os fatores que influenciam o salário podem variar, dependendo da função. Embora tenhamos respostas de pessoas em diversas funções (designers, gerentes de projetos e de produtos, etc.), o número de respostas é insuficiente para dar estimativas precisas do salário dessas funções. Portanto, a calculadora de salários mostra apenas as estimativas dos profissionais de programação (participantes plenamente empregados que têm alguma experiência profissional em programação).
  • A calculadora de salários tem opções limitadas de filtragem por países e linguagens de programação, pois só temos dados de pesquisa representativos para essas opções. Por exemplo, a lista de países não inclui a Áustria, porque não temos pontos de dados suficientes para darmos estimativas precisas.