Relâmpago: Revista em casa a partir de 9,90

IAs estão sendo treinadas com imagens de IA – e produzindo resultados bizarros

À medida que aprendem com outras IAs, a qualidade das imagens geradas piora – os resultados ficam mais parecidos entre si.

Por Leo Caparroz
1 ago 2023, 17h52

As inteligências artificiais (IAs) que produzem imagens são treinadas com outras imagens. Existem bancos de dados gigantescos com figuras associadas a descrições. As IAs “aprendem” o que é cada coisa, e assim montam o que você pediu.

Se você quiser um desenho de um gatinho, a IA vai caçar as fotos de gatos e gerar um resultado similar. Funciona para várias coisas: uvas, pessoas, paisagens, objetos. Para entendermelhor como elas funcionam, leia esta matéria da Super.

Essas IAs funcionam “aprendendo” as associações entre imagens e palavras. De tanto ver imagens de um objeto cilíndrico, transparente, com tinta no centro, ponta colorida e uma tampa sendo descrito como uma caneta esferográfica, ele aprende que aquilo é uma caneta esferográfica.

Mas tem um problema: conforme as imagens de IA inundam a internet, elas se infiltram também nos bancos de dados de outras IAs. Essa “retroalimentação” faz com que os resultados produzidos pelos programas sejam piores em qualidade e em diversidade.

Isso foi posto à prova por um grupo de pesquisadores. Eles treinaram IAs em imagens geradas por elas mesmas ou com imagens reais. Seus resultados batem com as expectativas – IAs têm piores desempenhos quando usam conteúdos de colegas para trabalhar.

Continua após a publicidade
Figura 18.
Este é um exemplo de primeira geração de imagens usado pelos cientistas. (arXiv:2307.01850/Divulgação)
Figura 22.
Depois de 9 gerações, muitas das imagens continham erros – alguns singelos, alguns gritantes. (arXiv:2307.01850/Divulgação)

Usando um banco de 70 mil rostos humanos tirados do serviço de fotos online Flickr, os pesquisadores produziram uma primeira geração de imagens artificiais. A partir daí, a geração seguinte era treinada com as imagens da anterior, e assim por diante. Com o tempo, essa autofagia começou a produzir resultados borrados ou imagens com ruídos e falhas.

Continua após a publicidade

Os pesquisadores tentaram retardar essa piora, filtrando as imagens que treinariam a geração seguinte. Mas aí surgiu outro problema: selecionando as fotos com mais qualidade, eles diminuíram drasticamente a diversidade dos rostos produzidos – depois de um tempo, todos eram praticamente iguais.

Figura 23.
Depois de uma primeira geração, essas foram as fotos selecionadas pelos pesquisadores como “melhores resultados”. (arXiv:2307.01850/Divulgação)
Figura 25.
Depois de apenas 5 gerações, elas já eram extremamente similares. (arXiv:2307.01850/Divulgação)
Continua após a publicidade

Imagine o exemplo da caneta esferográfica novamente. Aquela descrição dada lá em cima não compreende todas as canetas esferográficas existentes; nem todas são transparentes, algumas escrevem com mais de uma cor, nem todas têm tampa e por aí vai.

Se uma IA tem mais referências de uma caneta padrão ENEM, ela vai produzir mais resultados que se pareçam com ela – e eles serão, em geral, melhores. Selecionar os “melhores resultados” também é selecionar os resultados mais abundantes na internet e nos bancos de dados, o que pode reforçar certos enviesamentos e preconceitos.

Outras tentativas dos pesquisadores de desviar do problema apenas retardaram a piora, que sempre chegava mais cedo ou mais tarde. Para eles, grandes empresas de tecnologia não serão tão afetadas, por poderem bancar filtragens dos dados que treinarão suas IAs. A bucha vai ficar para empresas menores, que extraem os dados integralmente da internet e podem, sem querer, incorporar imagens sintéticas.

Compartilhe essa matéria via:
Publicidade


Matéria exclusiva para assinantes. Faça seu login

Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

Digital Completo

Acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*
Apenas 5,99/mês
DIA DAS MÃES

Revista em Casa + Digital Completo

Receba Super impressa e tenha acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*
A partir de 10,99/mês

*Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
Pagamento único anual de R$71,88, equivalente a R$ 5,99/mês.

PARABÉNS! Você já pode ler essa matéria grátis.
Fechar

Não vá embora sem ler essa matéria!
Assista um anúncio e leia grátis
CLIQUE AQUI.