Assine SUPER por R$2,00/semana
Continua após publicidade

O computador que reconhece a voz tão bem como um humano já existe

Microsoft criou um sistema de reconhecimento de voz que pode ser uma revolução para quem precisa escrever conteúdos gravados

Por Pâmela Carbonari Materia seguir SEGUIR Materia seguir SEGUINDO
Atualizado em 24 out 2016, 17h21 - Publicado em 24 out 2016, 17h09

Antes mesmo de entrar na faculdade de jornalismo, já sabia quais seriam alguns dos grandes dilemas da profissão: trabalhar sob pressão, não ter todos os domingos e feriados, não ter muito dinheiro, estar aberta a críticas e apurar informações incessantemente. Mas logo nas primeiras experiências com um gravador na mão descobri outro entrave necessário: a gravação. Que pesadelo transcrever (em jornalistiquês, decupar, bater fita). Todo jornalista sabe o inferno que é ouvir segundo a segundo de uma gravação e passar as palavras para tela ou papel. Em um cenário produtivo e otimista, 20 minutos de entrevista se prolongam por uma hora de trabalho.

Mas a Microsoft acaba de livrar os jornalistas dessa. O time de inteligência artificial da empresa desenvolveu um sistema capaz de reconhecer a voz e transformá-la em texto. A conquista é um marco importante para a empresa, porque em 20 anos de pesquisa é a primeira vez que uma tecnologia com essa função atinge uma margem de erro que se equipara a dos humanos desempenhando a mesma tarefa. O software discerne palavras tão bem quanto duas pessoas entendem uma à outra num diálogo.

Os engenheiros  criaram o sistema usando treinamento acústico junto com redes neurais para reconhecer padrões e armazenar grandes quantidades de dados. Em um experimento, pediram para que pessoas habituadas a transcrever áudios (não há indícios de que tenham sido jornalistas, mas a redação da Super poderia ter sido cobaia) escutassem um diálogo e decupassem a conversa. Em seguida, o mesmo teste foi feito com a tecnologia da Microsoft. O resultado homem vs. máquina foi surpreendente: ambos acertaram 94,1% da transcrição. Os criadores afirmam que é provável que pessoas que não estejam acostumadas a transcrever áudios errem mais do que o sistema desenvolvido por eles. A ideia agora é adaptar a tecnologia a programas de acessibilidade, chats e videogames. Outro desafio será melhorar a performance em locais barulhentos.

Até semana passada, costumava brincar que não era possível que o homem tivesse chegado à Lua, arquitetado um acelerador de partículas, conquistado todos os mares e continentes, desenvolvido um aparelho que faz ligação, paga seu aluguel e manda nudes, mas ainda não tivesse criado algo para transcrever uma entrevista. Só não imaginava que essa piada estava com os minutos contados – meu tempo livre, que agora cresceu, agradece.

Publicidade

Matéria exclusiva para assinantes. Faça seu login

Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

Domine o fato. Confie na fonte.

10 grandes marcas em uma única assinatura digital

MELHOR
OFERTA

Digital Completo
Digital Completo

Acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de R$ 2,00/semana*

ou
Impressa + Digital
Impressa + Digital

Receba Super impressa e tenha acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de R$ 12,90/mês

*Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
*Pagamento único anual de R$96, equivalente a R$2 por semana.

PARABÉNS! Você já pode ler essa matéria grátis.
Fechar

Não vá embora sem ler essa matéria!
Assista um anúncio e leia grátis
CLIQUE AQUI.