GABRILA65162183544miv_Superinteressante Created with Sketch.

Lei universal da linguística é explicada após quase 100 anos

Boa parte do nosso vocabulário é específico ou genérico demais para ser útil – e a Lei de Zipf (1935), que prevê a frequência com que usamos as palavras em qualquer língua, é só uma consequência matemática disso

Você já parou para pensar em quais palavras você usa com mais frequência? Eu não – a vida já é difícil o suficiente quando eu não estou fazendo um levantamento estatístico de tudo que sai da minha boca. É aí que entra uma coisa linda da ciência: não importa o quão absurdo seja o dado que você procura, sempre tem um maluco que, um século antes de você, já teve a ideia de quantificá-lo.

É o caso de George Kingsley Zipf, linguista norte-americano que morreu aos 48 anos em 1950. Ele notou que a palavra mais comum do inglês é o artigo the – que em português tem versão masculina e feminina, plural e singular (‘o’, ‘a’ etc.). As segundas mais comuns são and e of, que por aqui têm só um equivalente mesmo: ‘e’ e ‘de’. E por aí vai.

O crédito não é só dele – tempo e espaço o ajudaram. Zipf foi professor em Harvard na década de 1930, quando o telefone era uma invenção que ainda mexia com a imaginação das pessoas, a criptografia havia sido adotada de vez por exércitos do mundo todo e uma transmissão de Guerra dos Mundos (H.G. Wells) pelo rádio fez metade dos EUA fugir de casa com medo de uma invasão alienígena. Os países mais ricos investiam muito nas ciências da comunicação, e saber as palavras mais comuns de uma língua era essencial para criar (e quebrar) códigos.

O grande mérito de Zipf foi colocar a lista de palavras que eu comecei ali em cima em um gráfico – e perceber um padrão matemático na frequência de uso que valia para todas as línguas do mundo. A primeira palavra mais comum é usada exatamente duas vezes mais que a segunda. A segunda, duas vezes mais que a terceira. A terceira, duas vezes mais que a quarta. E por aí vai – entenda melhor com o gráfico abaixo.

(Radboud University//Lei universal da linguística é explicada após quase 100 anos/Reprodução)

Depois de quase cem anos de testes, a lei de Zipf continua tão certa quanto antes. É claro que ela é uma aproximação – afinal, a linguística é uma ciência humana, sujeita a flutuações. Mas é uma aproximação bastante segura, e uma prova curiosa de que, diferenças culturais à parte, há laços fortes unindo todas as línguas.

Outra coisa que ficou igual no último século é que a lei jamais ganhou uma explicação. A linguística aceita que dói menos – da mesma forma que os biólogos, até Darwin, aceitavam que as espécies eram criações divinas (e que você, até hoje, aplica equações nas aulas de física do ensino médio sem saber de onde elas vieram).

Bem, isso até agora. O holandês Sander Lestrade, da Universidade de Radboud, decidiu tirar o pó de Zipf – e encontrar uma explicação para a fórmula da década de 1930 usando um pouco de ciência contemporânea.

“Tanto no inglês como no holandês há só três artigos para dezenas de milhares de substantivos”, explicou Lestrade em anúncio à imprensa. “Como você usa o artigo antes de quase todo substantivo [o carro, a casa], os artigos ocorrem com muito mais frequência que os substantivos.” Até aí, sem novidade.

Acontece que entre os próprios substantivos também há grandes diferenças. A palavra ‘barco’, por exemplo, é muito mais versátil que ‘jangada’ ou ‘porta-aviões’, e por isso pode ser usada com mais frequência. Por outro lado, uma palavra versátil demais, como ‘coisa’, acaba não tendo tantas chances de aparecer. Os detalhes matemáticos estão no artigo científico.

“Se você fizer essa análise dentro das classes de palavras, você encontrará uma distribuição de Zipf perfeita”, explica o holandês. “Ela varia só um pouco do ideal, que é o que acontece com uma língua inteira [sem subdivisões por classes].” No final das contas, a lei é uma manifestação matemática do fato de que ser generalista demais não adianta nada – mas ser especialista demais também não é refresco.

Nada muito diferente da indústria musical: um artista que é completamente igual ao mainstream acaba não fazendo sucesso por ser muito genérico – mas um que é 100% hipster e toca música armênia também não, por ser muito específico. O equilíbrio vem na forma de algo como o System of a Down – que estourou misturando cultura armênia e heavy metal.

Como a comparação acima indica, o trabalho de Lestrade pode ter consequências que vão bem além da linguística. O padrão de Zipf dá as caras em todas as ciências sociais, da mesma forma que os padrões matemáticos descobertos pelo austríaco Friedrich Gauss são comuns nas ciências exatas. 

Comentários
Deixe um comentário

Olá, ( log out )

* A Abril não detém qualquer responsabilidade sobre os comentários postados abaixo, sendo certo que tais comentários não representam a opinião da Abril. Referidos comentários são de integral e exclusiva responsabilidade dos usuários que escreveram os respectivos comentários.

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

  1. Effeсtively, ԝhat does Goɗ like?? Lee
    added. ?I іmply, we likoe cookies and cartoons and toүs, һowever what sort οf issues are enmoyable f᧐r God??
    It wwaѕ a question that for a minute Mommy and
    Daddy needed to think abоut.

    Curtir