Desconto de até 39% OFF na assinatura digital
Imagem Blog

Supernovas

Por redação Super Materia seguir SEGUIR Seguindo Materia SEGUINDO
Este blog não é mais atualizado. Mas fique à vontade para ler o conteúdo por aqui!
Continua após publicidade

Lei universal da linguística é explicada após quase 100 anos

Boa parte do nosso vocabulário é específico ou genérico demais para ser útil – e a Lei de Zipf (1935), que prevê a frequência com que usamos as palavras em qualquer língua, é só uma consequência matemática disso

Por Bruno Vaiano Materia seguir SEGUIR Materia seguir SEGUINDO
Atualizado em 4 set 2024, 15h11 - Publicado em 10 ago 2017, 13h56

Você já parou para pensar em quais palavras você usa com mais frequência? Eu não – a vida já é difícil o suficiente quando eu não estou fazendo um levantamento estatístico de tudo que sai da minha boca. É aí que entra uma coisa linda da ciência: não importa o quão absurdo seja o dado que você procura, sempre tem um maluco que, um século antes de você, já teve a ideia de quantificá-lo.

É o caso de George Kingsley Zipf, linguista norte-americano que morreu aos 48 anos em 1950. Ele notou que a palavra mais comum do inglês é o artigo the – que em português tem versão masculina e feminina, plural e singular (‘o’, ‘a’ etc.). As segundas mais comuns são and e of, que por aqui têm só um equivalente mesmo: ‘e’ e ‘de’. E por aí vai.

O crédito não é só dele – tempo e espaço o ajudaram. Zipf foi professor em Harvard na década de 1930, quando o telefone era uma invenção que ainda mexia com a imaginação das pessoas, a criptografia havia sido adotada de vez por exércitos do mundo todo e uma transmissão de Guerra dos Mundos (H.G. Wells) pelo rádio fez metade dos EUA fugir de casa com medo de uma invasão alienígena. Os países mais ricos investiam muito nas ciências da comunicação, e saber as palavras mais comuns de uma língua era essencial para criar (e quebrar) códigos.

O grande mérito de Zipf foi colocar a lista de palavras que eu comecei ali em cima em um gráfico – e perceber um padrão matemático na frequência de uso que valia para todas as línguas do mundo. A primeira palavra mais comum é usada exatamente duas vezes mais que a segunda. A segunda, duas vezes mais que a terceira. A terceira, duas vezes mais que a quarta. E por aí vai – entenda melhor com o gráfico abaixo.

solutiontoac
(Radboud University/Reprodução)

Depois de quase cem anos de testes, a lei de Zipf continua tão certa quanto antes. É claro que ela é uma aproximação – afinal, a linguística é uma ciência humana, sujeita a flutuações. Mas é uma aproximação bastante segura, e uma prova curiosa de que, diferenças culturais à parte, há laços fortes unindo todas as línguas.

Outra coisa que ficou igual no último século é que a lei jamais ganhou uma explicação. A linguística aceita que dói menos – da mesma forma que os biólogos, até Darwin, aceitavam que as espécies eram criações divinas (e que você, até hoje, aplica equações nas aulas de física do ensino médio sem saber de onde elas vieram).

Bem, isso até agora. O holandês Sander Lestrade, da Universidade de Radboud, decidiu tirar o pó de Zipf – e encontrar uma explicação para a fórmula da década de 1930 usando um pouco de ciência contemporânea.

“Tanto no inglês como no holandês há só três artigos para dezenas de milhares de substantivos”, explicou Lestrade em anúncio à imprensa. “Como você usa o artigo antes de quase todo substantivo [o carro, a casa], os artigos ocorrem com muito mais frequência que os substantivos.” Até aí, sem novidade.

Acontece que entre os próprios substantivos também há grandes diferenças. A palavra ‘barco’, por exemplo, é muito mais versátil que ‘jangada’ ou ‘porta-aviões’, e por isso pode ser usada com mais frequência. Por outro lado, uma palavra versátil demais, como ‘coisa’, acaba não tendo tantas chances de aparecer. Os detalhes matemáticos estão no artigo científico.

“Se você fizer essa análise dentro das classes de palavras, você encontrará uma distribuição de Zipf perfeita”, explica o holandês. “Ela varia só um pouco do ideal, que é o que acontece com uma língua inteira [sem subdivisões por classes].” No final das contas, a lei é uma manifestação matemática do fato de que ser generalista demais não adianta nada – mas ser especialista demais também não é refresco.

Nada muito diferente da indústria musical: um artista que é completamente igual ao mainstream acaba não fazendo sucesso por ser muito genérico – mas um que é 100% hipster e toca música armênia também não, por ser muito específico. O equilíbrio vem na forma de algo como o System of a Down – que estourou misturando cultura armênia e heavy metal.

Continua após a publicidade

Como a comparação acima indica, o trabalho de Lestrade pode ter consequências que vão bem além da linguística. O padrão de Zipf dá as caras em todas as ciências sociais, da mesma forma que os padrões matemáticos descobertos pelo austríaco Friedrich Gauss são comuns nas ciências exatas. 

Publicidade

Matéria exclusiva para assinantes. Faça seu login

Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

Domine o fato. Confie na fonte.

10 grandes marcas em uma única assinatura digital

MELHOR
OFERTA

Digital Completo
Digital Completo

Acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de 6,00/mês

ou
Impressa + Digital
Impressa + Digital

Receba Super impressa e tenha acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de 14,90/mês

*Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
*Pagamento único anual de R$118,80, equivalente a 9,90/mês.

PARABÉNS! Você já pode ler essa matéria grátis.
Fechar

Não vá embora sem ler essa matéria!
Assista um anúncio e leia grátis
CLIQUE AQUI.