O computador que reconhece a voz tão bem como um humano já existe
Microsoft criou um sistema de reconhecimento de voz que pode ser uma revolução para quem precisa escrever conteúdos gravados
Antes mesmo de entrar na faculdade de jornalismo, já sabia quais seriam alguns dos grandes dilemas da profissão: trabalhar sob pressão, não ter todos os domingos e feriados, não ter muito dinheiro, estar aberta a críticas e apurar informações incessantemente. Mas logo nas primeiras experiências com um gravador na mão descobri outro entrave necessário: a gravação. Que pesadelo transcrever (em jornalistiquês, decupar, bater fita). Todo jornalista sabe o inferno que é ouvir segundo a segundo de uma gravação e passar as palavras para tela ou papel. Em um cenário produtivo e otimista, 20 minutos de entrevista se prolongam por uma hora de trabalho.
Mas a Microsoft acaba de livrar os jornalistas dessa. O time de inteligência artificial da empresa desenvolveu um sistema capaz de reconhecer a voz e transformá-la em texto. A conquista é um marco importante para a empresa, porque em 20 anos de pesquisa é a primeira vez que uma tecnologia com essa função atinge uma margem de erro que se equipara a dos humanos desempenhando a mesma tarefa. O software discerne palavras tão bem quanto duas pessoas entendem uma à outra num diálogo.
Os engenheiros criaram o sistema usando treinamento acústico junto com redes neurais para reconhecer padrões e armazenar grandes quantidades de dados. Em um experimento, pediram para que pessoas habituadas a transcrever áudios (não há indícios de que tenham sido jornalistas, mas a redação da Super poderia ter sido cobaia) escutassem um diálogo e decupassem a conversa. Em seguida, o mesmo teste foi feito com a tecnologia da Microsoft. O resultado homem vs. máquina foi surpreendente: ambos acertaram 94,1% da transcrição. Os criadores afirmam que é provável que pessoas que não estejam acostumadas a transcrever áudios errem mais do que o sistema desenvolvido por eles. A ideia agora é adaptar a tecnologia a programas de acessibilidade, chats e videogames. Outro desafio será melhorar a performance em locais barulhentos.
Até semana passada, costumava brincar que não era possível que o homem tivesse chegado à Lua, arquitetado um acelerador de partículas, conquistado todos os mares e continentes, desenvolvido um aparelho que faz ligação, paga seu aluguel e manda nudes, mas ainda não tivesse criado algo para transcrever uma entrevista. Só não imaginava que essa piada estava com os minutos contados – meu tempo livre, que agora cresceu, agradece.