IA do Google diz reconhecer músicas apenas com assovios. Nós testamos
Você costuma se lembrar da melodia das músicas, mas nunca de seu autor ou letra? Seus problemas acabaram. Ou quase isso.
Já ficou com uma música na cabeça mas não fazia ideia do nome dela? 99,9% de chances de que sim. Os curiosos, porém, têm alguma chance de descobrir qual é a tal canção graças à tecnologia. Ouvindo o som do ambiente, aplicativos como o Shazam – ou o próprio serviço de busca do Google –, por exemplo, conseguem sugerir o resultado que mais se aproxima daquele som. O problema é que, na maioria das vezes, a melodia está só na sua cabeça, e não tocando do lado de fora.
Como você, leitor da SUPER, talvez se lembre, até há algumas ferramentas que se arriscam na tentativa de acertar a canção que habita sua mente com menos informações, como seu ritmo. Mas essas alternativas on-line costumam ser um tanto limitadas. Quando a música em questão pertence ao domínio público, ou é um sucesso estrondoso, a inteligência artificial acerta. Canções mais desconhecidas, no entanto, costumam passar batido.
Um post que o Google fez em seu blog no último dia 15 de outubro, porém, anunciou uma novidade que pretende tornar essa busca mais fácil: a ferramenta “hum to search” – “cantarole para pesquisar,” em português. Com ela, o sistema de pesquisa por voz refinou sua capacidade em detectar uma música, permitindo, agora, que alguém o consiga cantarolando ou assoviando.
Para testá-la, é só entrar no aplicativo do Google e clicar no microfone, como se fosse fazer uma pesquisa por voz convencional. O passo seguinte é dizer “What is this song?” – do inglês “Que música é essa?”, já que ainda não é possível pesquisar em português – e, por fim, soltar a voz.
Basta que o usuário mantenha-se firme no embromation por 10 ou 15 segundos para a mágica acontecer. Enquanto a pessoa cantarola ou assovia, aparecem barras que indicam o volume do áudio que está sendo captado. Caso encontre algo parecido em seu banco de dados, a inteligência artificial fornece informações como o cantor, álbum e letra da música. O recurso está disponível em inglês no iPhone – e em 20 línguas para Android. “E não se preocupe, você não precisa ser afinado para usar a ferramenta”, garantiu a empresa no comunicado.
Segundo o Google, o segredo por trás do hum to search é a criação de um modelo que enxerga a “impressão digital” das músicas. Cada áudio, para o algoritmo, é nada além de uma sequência de números – o que torna cada canção algo único. Quando um usuário tentar identificar uma melodia com um assovio ou com seu próprio “lalala”, o que a IA faz é comparar a sequência numérica criada pela usuário com aquelas que possui em seu banco de dados. Depois, sugere o resultado que for mais próximo.
Em linhas gerais, vale dizer que a precisão do serviço impressiona. A IA do Google não teve problemas em identificar, baseada em assovios do repórter que vos fala, canções como We are the Champions, clássico do Queen, ou Orinoco Flow, de Enya, por exemplo.
“Mas são músicas que repetem a mesma sequência em vários momentos, assim fica fácil!”, um leitor mais crítico poderia argumentar. Não é bem assim. Mesmo canções com cadências menos convencionais – e ligeiramente menos famosas –, como Aqualung, do Jethro Tull e Selling England by The Pound, do Genesis, também foram acusadas após alguns segundos.
Ouvindo apenas um “nãnãnã”, a ferramenta também apontou com sucesso canções de gêneros musicais diversos – de Trem de doido, faixa do álbum Clube da Esquina composta por Flávio Venturini, até This Charming Man, do The Smiths – passando por músicas como 10%, de Maiara e Maraisa, e Subirusdoistiuzin, de Criolo.
Mas não vá esperando a solução definitiva para músicas escondidas na cabeça: como toda inteligência artificial, ela possui algum espaço para melhora – e também derrapa vez ou outra. Aparentemente, o problema mais comum é que a versão que aparece na busca nem sempre é a mais famosa – e a que você provavelmente está procurando.
Ao assoviar o início de Shape of You, hit de Ed Sheeran, por exemplo, fomos levados ao funk Bye Bye, Falou, do brasileiro MC Lipi. Tudo porque o sample usado no início da canção brasileira é emprestado da composição do cantor britânico.
O mesmo aconteceu com In the hall of Mountain King: em vez de aparecer a peça de música clássica composta pelo norueguês Edvard Grieg, o resultado sugerido pela IA Google foi a versão do DJ Timmy Trumpet com o cantor letão Vitas, numa apresentação ao vivo na edição 2019 do Tomorrowland. Um erro tão bom que merece ser destacado abaixo.
Aliás, esqueça do sonho de tentar encontrar alguma música por seu instrumental. Riffs de rock famosos, como Sweet Child O’Mine, do Guns n’Roses, Master of Puppets, do Metallica, Cowboys from Hell, do Pantera, ou Stairway to Heaven, do Led Zeppelin, passaram batido pelo robô do Google. O mesmo vale para a introdução de Que país é esse, composição de Renato Russo. Não dá para acertar sempre.