Bruno Garattoni

Por Bruno Garattoni

Vencedor de 15 prêmios de Jornalismo. Editor da Super.

Tecnologia

Galaxy S23 permite clonar a voz do dono, usando IA, para responder ligações

Função já está disponível na Coreia do Sul, e transforma as chamadas telefônicas em chats: você digita e o smartphone fala, usando a sua voz, com a outra pessoa; IAs de clonagem vocal têm um lado perigoso

Por Bruno Garattoni SEGUIR SEGUINDO
Atualizado em 6 set 2024, 15h43 - Publicado em 24 fev 2023, 14h30

Fotografia de um Galaxy S23. — (Bloomberg/Getty Images)

Função já está disponível na Coreia do Sul, e transforma as chamadas telefônicas em chats: você digita e o smartphone fala, usando a sua voz, com a outra pessoa; IAs de clonagem vocal têm um lado perigoso, e podem se tornar um problema nos próximos anos

O novo recurso, que já está disponível nos smartphones Galaxy S23, S23+ e S23 Ultra vendidos na Coreia do Sul, se chama Bixby Custom Voice Creator (porque é baseado no assistente virtual Bixby, da Samsung). Ele analisa a voz do dono do celular, e usa inteligência artificial para criar uma versão clonada dela – que, então, pode ser usada para responder ligações.

A ideia é a seguinte. Quando você receber uma ligação mas não puder (ou quiser) atendê-la, poderá digitar uma resposta – que o smartphone lerá, usando a sua voz, para a pessoa que está ligando. O sistema, que por enquanto só está disponível em coreano, também converte em texto, em tempo real, o que a outra pessoa está falando. Veja no GIF abaixo:

demo de recurso do Galaxy S23 — – (Samsung/Divulgação)

Ainda há poucos detalhes sobre o funcionamento do sistema, seu processamento de dados (se é feito localmente ou nos servidores da Samsung), eventuais limitações de uso e, principalmente, a qualidade da voz sintetizada.

Continua após a publicidade

Mas é possível que o resultado seja bem realista: nos últimos anos, surgiram vários algoritmos de IA que conseguem clonar vozes com alta precisão. E eles foram se tornando mais rápidos. Os primeiros softwares exigiam alguns minutos de gravações da voz de alguém para conseguir cloná-la.

Mas, em janeiro, a Microsoft apresentou o VALL-E, um algoritmo que é capaz de reproduzir a voz de uma pessoa de forma praticamente instantânea: uma amostra de três segundos já é suficiente para alimentar o robô, que produz resultados bastante convincentes.

Isso significa que as IAs de clonagem de voz, caso sejam liberadas na internet (ou surjam versões livres, de código aberto, delas) podem se tornar um problema sério.

Continua após a publicidade

Elas poderiam ser usadas para forjar declarações de políticos, por exemplo, e produzir falsas gravações comprometedoras que seriam apresentadas à imprensa, e noticiadas como provas de falsos escândalos.

É um risco real. Apesar disso, a clonagem de voz caminha para se tornar parte do dia a dia. Ontem o Spotify lançou, nos Estados Unidos, um DJ sintetizado por inteligência artificial: ele é como se fosse um locutor de rádio, que vai acompanhando e comentando as músicas que você ouve. Veja um exemplo no vídeo:

O realismo e a naturalidade da voz sintetizada impressionam. Ela foi clonada de Xavier Jernigan, apresentador de um podcast do Spotify. E usa tecnologia da empresa Sonantic AI, que foi comprada pelo Spotify em 2022. Por enquanto, a nova função só está disponível em inglês, para assinantes do Spotify Premium nos EUA.