Algoritmo GPT-4, que promete um salto de inteligência, poderá ser apresentado já nos próximos dias, afirma executivo; robô poderá gerar vídeos a partir dos prompts que você digitar

“Nós vamos apresentar o GPT-4 na próxima semana, e haverá modelos multimodais que oferecerão possibilidades totalmente novas – vídeos, por exemplo”, disse Andreas Braun, chief technical officer da Microsoft na Alemanha, em um evento sobre IA na última quinta-feira.

É a primeira vez que a empresa fala concretamente sobre o algoritmo GPT-4 – que foi desenvolvido por sua parceira, a OpenAI (no final de janeiro, a Microsoft comprou parte dessa startup, a criadora do ChatGPT).

O GPT-4 (sigla para “transformador gerador pré-treinado”, em inglês) está sendo desenvolvido há dois anos, e promete um grande salto em relação ao atual GPT-3/3.5, que é utilizado no robô ChatGPT. Ele supostamente será mais inteligente, pois possui um número maior de “tokens” (palavras) e “parâmetros” (relações entre elas) – explicamos em detalhes na reportagem “O futuro da IA”.

O ChatGPT se tornou um megasucesso, com mais de 100 milhões de usuários, e detonou todo tipo de previsões e especulações sobre o futuro da inteligência artificial e suas consequências para a sociedade.

Mas a tecnologia na qual ele se baseia é relativamente antiga: o algoritmo GPT-3 foi criado pela OpenAI em 2020. A novidade é que, no final do ano passado, ele foi liberado na internet, para qualquer pessoa usar (antes, só pesquisadores e pessoas autorizadas pela OpenAI podiam fazer isso).

A Microsoft e a OpenAI não confirmaram a declaração de Braun – talvez ele tenha falado demais. Mas o lançamento do GPT-4 é considerado iminente: quando o ChatGPT foi liberado, a nova versão do algoritmo já estava praticamente pronta – e a OpenAI teria decidido adiá-la um pouco, para aproveitar a onda de popularidade do robô online.

A expectativa em torno do GPT-4 explodiu depois que o presidente da Cerebras Systems, uma fabricante de chips de inteligência artificial, disse que essa versão do algoritmo poderia conter até 100 trilhões de parâmetros – um salto gigantesco em relação aos 175 bilhões do GPT-3, usado no ChatGPT. Mas, com o hardware existente hoje, isso é considerado tecnicamente inviável.

O GPT-4 pode ter muito menos do que 100 trilhões de parâmetros, e mesmo assim dar um grande passo à frente dos algoritmos atuais. Segundo Braun, da Microsoft, ele será capaz de sintetizar vídeos: você digitará o que quer ver, e a IA vai gerar um clipe mostrando aquilo.

Já existe um algoritmo do tipo: o Make-a-Video, que foi apresentado pela Meta em setembro de 2022. Ele é capaz de gerar resultados surpreendentes (pense nas imagens geradas por IAs como DALL-E e Stable Diffusion, só que em movimento), mas não foi liberado ao público.

A Runway ML, criadora do Stable Diffusion, também criou um algoritmo de geração de vídeo, o Gen-1 – que está em beta fechado.

Os vídeos gerados por esses dois algoritmos são facilmente identificáveis: eles têm várias imperfeições, que deixam claro se tratar de algo gerado por IA.

Mas, no futuro, se as ferramentas de inteligência artificial se tornarem capazes de gerar vídeos convincentes, isso poderá ter consequências profundas: desde uma transformação no setor de mídia (haveria emissoras de TV, canais do YouTube, filmes e séries gerados usando IA), até impactos sobre a própria comunicação online – com uma explosão na geração de vídeos forjados, dificultando ou impedindo saber o que é real ou falso.

