Galaxy S23 permite clonar a voz do dono, usando IA, para responder ligações
Função já está disponível na Coreia do Sul, e transforma as chamadas telefônicas em chats: você digita e o smartphone fala, usando a sua voz, com a outra pessoa; IAs de clonagem vocal têm um lado perigoso
Função já está disponível na Coreia do Sul, e transforma as chamadas telefônicas em chats: você digita e o smartphone fala, usando a sua voz, com a outra pessoa; IAs de clonagem vocal têm um lado perigoso, e podem se tornar um problema nos próximos anos
O novo recurso, que já está disponível nos smartphones Galaxy S23, S23+ e S23 Ultra vendidos na Coreia do Sul, se chama Bixby Custom Voice Creator (porque é baseado no assistente virtual Bixby, da Samsung). Ele analisa a voz do dono do celular, e usa inteligência artificial para criar uma versão clonada dela – que, então, pode ser usada para responder ligações.
A ideia é a seguinte. Quando você receber uma ligação mas não puder (ou quiser) atendê-la, poderá digitar uma resposta – que o smartphone lerá, usando a sua voz, para a pessoa que está ligando. O sistema, que por enquanto só está disponível em coreano, também converte em texto, em tempo real, o que a outra pessoa está falando. Veja no GIF abaixo:
Ainda há poucos detalhes sobre o funcionamento do sistema, seu processamento de dados (se é feito localmente ou nos servidores da Samsung), eventuais limitações de uso e, principalmente, a qualidade da voz sintetizada.
Mas é possível que o resultado seja bem realista: nos últimos anos, surgiram vários algoritmos de IA que conseguem clonar vozes com alta precisão. E eles foram se tornando mais rápidos. Os primeiros softwares exigiam alguns minutos de gravações da voz de alguém para conseguir cloná-la.
Mas, em janeiro, a Microsoft apresentou o VALL-E, um algoritmo que é capaz de reproduzir a voz de uma pessoa de forma praticamente instantânea: uma amostra de três segundos já é suficiente para alimentar o robô, que produz resultados bastante convincentes.
Isso significa que as IAs de clonagem de voz, caso sejam liberadas na internet (ou surjam versões livres, de código aberto, delas) podem se tornar um problema sério.
Elas poderiam ser usadas para forjar declarações de políticos, por exemplo, e produzir falsas gravações comprometedoras que seriam apresentadas à imprensa, e noticiadas como provas de falsos escândalos.
É um risco real. Apesar disso, a clonagem de voz caminha para se tornar parte do dia a dia. Ontem o Spotify lançou, nos Estados Unidos, um DJ sintetizado por inteligência artificial: ele é como se fosse um locutor de rádio, que vai acompanhando e comentando as músicas que você ouve. Veja um exemplo no vídeo:
O realismo e a naturalidade da voz sintetizada impressionam. Ela foi clonada de Xavier Jernigan, apresentador de um podcast do Spotify. E usa tecnologia da empresa Sonantic AI, que foi comprada pelo Spotify em 2022. Por enquanto, a nova função só está disponível em inglês, para assinantes do Spotify Premium nos EUA.