Com apenas uma foto, algoritmo da Samsung consegue criar um vídeo falso
Celebridades, figuras históricas e até pinturas. Software consegue simular o movimento de um rosto a partir de uma única imagem. Veja como ele funciona.
Ter um retrato que se mexe não é exclusividade do universo de Harry Potter. Pelo menos, não para a equipe de inteligência artificial da Samsung em Moscou. Nesta semana, os pesquisadores de lá anunciaram a criação de um algoritmo capaz de movimentar um rosto usando apenas uma única imagem de referência.
O estudo que descreve o funcionamento da tecnologia foi publicado na última segunda (20). O programa funciona, basicamente, como outros softwares de deep fake. O termo mistura, em inglês, as palavras “fake” (“falso”) com a expressão “deep learning” (“aprendizado profundo”), uma técnica usada em computação para fazer com que um algoritmo aprenda a seguir padrões após muitas repetições.
O objetivo disso é fazer com que um robô saiba como tomar decisões precisas com base em experiências anteriores. As aplicações do chamado machine learning são diversas: de melhorar sistemas de carros autônomos, com base em registros de acidentes rodoviários até, claro, criar vídeos falsos.
Você provavelmente já deve ter visto alguns exemplos na internet, como o vídeo que emula um discurso de Barack Obama, ex-presidente dos EUA. Ou ainda o que coloca o rosto do ator Harrison Ford nas cenas do filme Han Solo: Uma História Star Wars.
No vídeo abaixo, há uma pequena demonstração do algoritmo russo:
Como o programa precisa de apenas uma imagem para funcionar, é possível aplicá-lo em figuras histórias, como o escritor russo Fiódor Dostoiévski (1832-1881), e até de pinturas, como a Mona Lisa.
Ok. Vamos combinar que essa última ficou, no mínimo, estranha.
Como o algoritmo funciona?
O programa já consegue rodar com uma única foto de referência. No entanto, ele permite inserir mais imagens (8 ou 32) para tornar a representação mais precisa.
Ao contrário dos softwares tradicionais de deep fake, o algoritmo russo possui um mecanismo inovador. Ao invés de analisar diversas imagens e vídeos de uma mesma pessoa, como se costuma fazer, aqui o processo é diferente: usar um grande banco de dados com diversas faces para mapear expressões gerais e pontos marcantes em todo ser humano – lábios, olhos e sobrancelhas, por exemplo.
Na prática, eles desenvolveram uma espécie de “molde”, que consegue simular movimentos comuns do nosso rosto. Para isso, eles recorreram ao VoxCeleb, um banco de dados público com mais de 7 mil imagens e vídeos de celebridades. Daí, com o rosto genérico programado, basta inserir uma imagem por cima.
Muito Black Mirror? Ferramentas do tipo podem ter uma boa utilidade, mas existe a preocupação sobre os problemas que o deep fake pode causar. No futuro, será preciso um esforço cada vez maior para comprovar que você é, de fato, você.