Silva, Santos, Oliveira, Souza e Pereira são os sobrenomes mais comuns de 46,8 milhões de trabalhadores do setor privado, com idade entre 23 a 60 anos, no Brasil.

Juntos, respondem por cerca de 45% dos sobrenomes que constavam, em 2013, na Relação Anual de Informações Sociais (Rais), uma base de dados socioeconômicos do Ministério do Trabalho.

Mas, se comparados aos de outras origens - em especial japonesa e germânica -, as chances de os brasileiros que carregam esses cinco sobrenomes tão comuns ganharem salários menores são grandes.

1 de 3 Ancestralidade dos 100 sobrenomes — Foto: BBC Ancestralidade dos 100 sobrenomes — Foto: BBC

Uma pessoa com sobrenome de ancestralidade japonesa, por exemplo, recebe, em média, um salário 16,8% maior que um pessoa branca com sobrenome ibérico. Os germânicos, por sua vez, recebem 8% mais que os indivíduos brancos com sobrenomes portugueses e espanhóis.

Pardos, negros e índios, refletindo a já conhecida desigualdade que persiste no país, ganham menos.

Quando o critério são apenas os 100 maiores salários registrados na Rais, porém, os alemães se destacam - e os japoneses vão para o fim desse seleto ranking.

2 de 3 Distribuição dos sobrenomes — Foto: BBC Distribuição dos sobrenomes — Foto: BBC

Nessa lista, segundo a base do Ministério do Trabalho, 43 carregam sobrenomes de ancestralidade alemã, 22 italiana e 17 ibérica (veja quadro).

Esses dados fazem parte de uma série de estudos do economista Leonardo Monasterio, do Ipea (Instituto de Pesquisa Econômica Aplicada), que tem se dedicado a pesquisar sobrenomes, ancestralidade, diversidade cultural e mobilidade social no Brasil.

Automatização de padrões

Ele conseguiu identificar a origem de sobrenomes de brasileiros usando uma técnica chamada de machine learning - método de análise de dados que automatiza a busca e a identificação de padrões.

3 de 3 Quem ganha mais no Brasil? — Foto: BBC Quem ganha mais no Brasil? — Foto: BBC

Monasterio é um dos primeiros a aplicar essa metodologia para analisar a ancestralidade de nomes de brasileiros. Levou um ano pesquisando a origem dos sobrenomes, buscando padrões linguísticos e criando algorítmicos para automatizar a identificação - fase da pesquisa conduzida na Universidade da Califórnia (UCLA), nos EUA.

Primeiro, ele rastreou 71,7 mil sobrenomes distintos, usando bases de dados nacionais e estrangeiros, e os classificou em cinco origens diferentes: italiana (26.191), alemã (22.502), ibérica (10.142), europeia do leste (7.581) e japonesa (5.375).

Depois, cruzou esses dados com o banco da Rais de 2013, que listava dados de mais de 46 milhões de trabalhadores.

Além de descobrir os cinco sobrenomes mais comuns, ele também constatou que 88,1% dos trabalhadores brasileiros tinham um último nome de origem ibérica - Monasterio utilizou apenas o último sobrenome de cada indivíduo para fazer suas análises.

"Foi preciso criar um padrão linguístico, um jeito de classificar. Claro que há imperfeições, mas a automatização vai aprimorando com o tempo", explica o pesquisador que, a princípio, estava interessado principalmente em criar um mecanismo de identificação de sobrenomes dos brasileiros.

No entanto, acabou analisando também variações nos dados socioeconômicos de quem carrega sobrenomes de diferentes origens.

Com o tempo, sua pesquisa foi ganhando mais corpo e ele foi inserindo novas variáveis - como sobrenomes de origem sírio-libanesa, raça e performance em exames de matemática no ensino médio.

Quando analisada toda a base de dados (e não apenas os 100 salários mais altos), as associações positivas identificadas pelo pesquisador revelam, por exemplo, que as pessoas com sobrenomes de ancestralidade japonesa, seguidas pelas com nomes de origem germânica, sírio-libanesa, lestes europeia e italiana, nessa ordem, têm, em média, maiores salários que os de brancos ibéricos.

Pardos, negros e indígenas ganham menos: -3,3%, -5,5% e -10,3%, respectivamente.

Relação causal

Mas Monsterio admite que seus achados levantam muitas perguntas. Aos poucos, com mais pesquisa, ele as tenta responder testando novas hipóteses.

"Apesar da associação positiva, que já é um dado relevante e importante, a causalidade não é clara. Talvez não seja apenas o sobrenome, sozinho, que impacte no salário", observa o pesquisador.

Monasterio diz que os ganhos também podem estar associados a outras variáveis como, por exemplo, a cor da pele, o gênero e a qualidade da educação que a pessoa teve.

"Anos de estudo não indicam o tipo de formação", afirma, ponderando que, por exemplo, europeus e japoneses que vieram ao Brasil tinham em média mais anos de estudo que os brasileiros herdeiros dos portugueses e espanhóis.

Isso, segundo o pesquisador, pode ter representado uma certa vantagem familiar que impactou as gerações seguintes.

A distribuição geográfica dos nomes pode influenciar também no tamanho dos salários. A região centro-sul do Brasil, onde salários e nível de escolaridade tendem a ser mais altos, concentra a maioria dos sobrenomes não ibéricos.

Já os nomes de origem portuguesa e espanhola aparecem mais concentrados no Nordeste e no Norte, onde renda e anos de estudo são naturalmente menores.

São Paulo, onde, em média, se paga os maiores salários do país, tem uma grande concentração de descendentes de japoneses.

Além de serem os que ganham salários mais altos, os indivíduos com ancestralidade japonesa se destacam também por terem mais anos de estudo - em média 13,6 anos - e por tirarem melhores notas em provas de matemática, descobriu Monasterio.

"As evidências são robustas e estatisticamente significantes", afirma o pesquisador, emendando que é necessário "abrir a caixa preta e entender o porquê dessas diferenças".

Potencial

As pesquisas de Monasterio têm o potencial de contribuir para um campo relativamente pouco explorado no Brasil, em especial porque ele tem usado tecnologia para identificar a mobilidade dos imigrantes, em especial os que chegaram entre a Primeira e a Segunda Guerra, e o impacto da imigração na economia do país.

A motivação para se aprofundar no tema veio da própria história do pesquisador.