Fontes de dados

Para estimar o número de desenvolvedores em um determinado país, reunimos dados de organizações trabalhistas internacionais (como a Eurostat) e usamos estatísticas nacionais daquele país (por exemplo, usamos a Statistics Canada para o Canadá). Como diferentes países têm definições diferentes do termo "programador", coletamos os dados mais relevantes para fins do nosso estudo. Por exemplo, nos EUA, as seguintes profissões se encaixam relativamente bem na definição de "programador":

  • 15-1131 Programadores de Computador
  • 15-1132 Desenvolvedores de Software, Aplicativos
  • 15-1133 Desenvolvedores de Software, Sistemas
  • 15-1134 Desenvolvedores para a Web

Todos os anos, realizamos uma pesquisa sobre o Ecossistema dos Desenvolvedores, na qual procuramos 30.000 desenvolvedores em todo o mundo. Esses dados têm sido instrumentais para montarmos nosso modelo de pesquisa. Eles nos permitem obter uma compreensão abrangente da comunidade dos desenvolvedores, incluindo insights sobre linguagens de programação, ferramentas e tecnologias populares, preferências dos desenvolvedores e tendências emergentes.

Nosso modelo

Nós nos baseamos no tamanho da população e no número de desenvolvedores (X) em um país específico em um determinado ano (T) para montar nosso modelo. Usamos os últimos dados acessíveis publicamente de cada país para identificar o ano com as informações mais atualizadas para nossos cálculos. Isso nos permite calcular a densidade de desenvolvedores naquele país, naquele ano específico.

DevDensity = DevNumber/Population

Para calcularmos o número de desenvolvedores em anos mais recentes (T+1, T+2, …) no mesmo país, presumimos que a densidade é constante e a aplicamos aos dados recentes de população daquele país, segundo as estimativas das Nações Unidas. Com base em uma análise retrospectiva, esse modelo demonstrou ser eficaz. Para calcular o número de desenvolvedores em um país sobre o qual faltam dados, usamos dados de outros países da mesma região (representados por "Y"). Para cada país Y, calculamos a densidade média em todos os anos com dados conhecidos. Então, escolhemos um quantil de 10% dentre as médias resultantes. Isso dá a densidade aproximada de desenvolvedores no país X.

Depois de calcularmos a densidade da população geral de desenvolvedores, podemos inferir o tamanho de uma categoria específica de desenvolvedores dentro daquela comunidade. Sabendo a parcela da categoria de interesse na amostra dos dados da pesquisa sobre o Estado do Ecossistema dos Desenvolvedores (por exemplo, programadores que usam Python entre todos os programadores), podemos calcular o tamanho dessa categoria específica da seguinte forma:

CategorySize = CategoryShare х DevPopulation

Vamos presumir que queiramos estimar o número de desenvolvedores que usam Python nos EUA em 2023.

Temos os dados do Estado do Ecossistema dos Desenvolvedores em 2023 e podemos usar as respostas às seguintes perguntas da pesquisa:

  • Qual é o seu país ou região?
  • Quais linguagens de programação você utilizou nos últimos 12 meses?

De todos os participantes que responderam "Estados Unidos" como sendo seu país ou região, a parcela dos desenvolvedores dos EUA que usam Python seria estimada como sendo a parcela ponderada dos participantes que responderam "Python" como sua linguagem de programação.

Então, a estimativa do número de desenvolvedores que usam Python nos EUA em 2023 pode ser calculada da seguinte forma:

SizeUsaPython = ShareUsaPython х DevPopulationUSA

Limitações

Nossa metodologia tem várias limitações:

Atualmente, nosso modelo considera apenas desenvolvedores profissionais. Não incluímos estudantes ou programadores por hobby, porque nossos dados e nossa metodologia não são suficientes para incluirmos essas pessoas.

Quando faltam dados de um ano específico, usamos os dados mais recentes disponíveis. Faltam dados de alguns países e esses dados têm que ser substituídos ou limpos.

Nosso painel tem opções limitadas de filtragem e inclui apenas aquelas opções sobre as quais temos dados abrangentes.

Os dados refletem apenas o valor mais provável (previsão média) e não devem ser considerados valores exatos. Com base em testes retrospectivos do modelo, os valores reais desviam-se dos previstos por uma média de 14% (métrica MAPE). Isso nos dá uma ideia do quanto os valores verdadeiros podem se desviar das previsões mostradas no painel.

Calculadora de salários

Nossa calculadora de salários baseia-se nos dados reunidos na nossa pesquisa anual sobre o Ecossistema dos Desenvolvedores. Os dados sobre salários foram obtidos perguntando aos participantes seu salário líquido anual em dólares (depois dos impostos), excluindo quaisquer bônus.

A metodologia da nossa calculadora de salários tem várias limitações:

  • Os participantes são solicitados a informar seus salários na forma de faixas, em vez de valores específicos de salário. Isso significa que a calculadora de salários só pode dar estimativas dentro dessas faixas e talvez não possa dar estimativas precisas.
  • Os fatores que influenciam o salário podem variar, dependendo da função. Embora tenhamos respostas de pessoas em diversas funções (designers, gerentes de projetos e de produtos, etc.), o número de respostas é insuficiente para dar estimativas precisas do salário dessas funções. Portanto, a calculadora de salários mostra apenas as estimativas dos profissionais de programação (participantes plenamente empregados que têm alguma experiência profissional em programação).
  • Quando faltam dados de um ano específico, usamos os dados mais recentes disponíveis.
  • A calculadora de salários tem opções limitadas de filtragem por países e linguagens de programação, pois só temos dados de pesquisa representativos para essas opções. Por exemplo, a lista de países não inclui a Áustria, porque não temos pontos de dados suficientes para darmos estimativas precisas.