Bruno Garattoni

Por Bruno Garattoni

Vencedor de 15 prêmios de Jornalismo. Editor da Super.

Tecnologia

Microsoft e OpenAI preparam nova versão do ChatGPT – que será capaz de gerar vídeos

Algoritmo GPT-4, que promete um salto de inteligência, poderá ser apresentado já nos próximos dias, afirma executivo; robô poderá gerar vídeos a partir dos prompts que você digitar

Por Bruno Garattoni SEGUIR SEGUINDO
Atualizado em 6 set 2024, 15h43 - Publicado em 13 mar 2023, 15h02

Homem usando tecnologia robô inteligente AI — (hirun/Getty Images)

Algoritmo GPT-4, que promete um salto de inteligência, poderá ser apresentado já nos próximos dias, afirma executivo; robô poderá gerar vídeos a partir dos prompts que você digitar

“Nós vamos apresentar o GPT-4 na próxima semana, e haverá modelos multimodais que oferecerão possibilidades totalmente novas – vídeos, por exemplo”, disse Andreas Braun, chief technical officer da Microsoft na Alemanha, em um evento sobre IA na última quinta-feira.

É a primeira vez que a empresa fala concretamente sobre o algoritmo GPT-4 – que foi desenvolvido por sua parceira, a OpenAI (no final de janeiro, a Microsoft comprou parte dessa startup, a criadora do ChatGPT).

O GPT-4 (sigla para “transformador gerador pré-treinado”, em inglês) está sendo desenvolvido há dois anos, e promete um grande salto em relação ao atual GPT-3/3.5, que é utilizado no robô ChatGPT. Ele supostamente será mais inteligente, pois possui um número maior de “tokens” (palavras) e “parâmetros” (relações entre elas) – explicamos em detalhes na reportagem “O futuro da IA”.

O ChatGPT se tornou um megasucesso, com mais de 100 milhões de usuários, e detonou todo tipo de previsões e especulações sobre o futuro da inteligência artificial e suas consequências para a sociedade.

Continua após a publicidade

Mas a tecnologia na qual ele se baseia é relativamente antiga: o algoritmo GPT-3 foi criado pela OpenAI em 2020. A novidade é que, no final do ano passado, ele foi liberado na internet, para qualquer pessoa usar (antes, só pesquisadores e pessoas autorizadas pela OpenAI podiam fazer isso).

A Microsoft e a OpenAI não confirmaram a declaração de Braun – talvez ele tenha falado demais. Mas o lançamento do GPT-4 é considerado iminente: quando o ChatGPT foi liberado, a nova versão do algoritmo já estava praticamente pronta – e a OpenAI teria decidido adiá-la um pouco, para aproveitar a onda de popularidade do robô online.

A expectativa em torno do GPT-4 explodiu depois que o presidente da Cerebras Systems, uma fabricante de chips de inteligência artificial, disse que essa versão do algoritmo poderia conter até 100 trilhões de parâmetros – um salto gigantesco em relação aos 175 bilhões do GPT-3, usado no ChatGPT. Mas, com o hardware existente hoje, isso é considerado tecnicamente inviável.

Continua após a publicidade

O GPT-4 pode ter muito menos do que 100 trilhões de parâmetros, e mesmo assim dar um grande passo à frente dos algoritmos atuais. Segundo Braun, da Microsoft, ele será capaz de sintetizar vídeos: você digitará o que quer ver, e a IA vai gerar um clipe mostrando aquilo.

Já existe um algoritmo do tipo: o Make-a-Video, que foi apresentado pela Meta em setembro de 2022. Ele é capaz de gerar resultados surpreendentes (pense nas imagens geradas por IAs como DALL-E e Stable Diffusion, só que em movimento), mas não foi liberado ao público.

A Runway ML, criadora do Stable Diffusion, também criou um algoritmo de geração de vídeo, o Gen-1 – que está em beta fechado.

Continua após a publicidade

Os vídeos gerados por esses dois algoritmos são facilmente identificáveis: eles têm várias imperfeições, que deixam claro se tratar de algo gerado por IA.

Mas, no futuro, se as ferramentas de inteligência artificial se tornarem capazes de gerar vídeos convincentes, isso poderá ter consequências profundas: desde uma transformação no setor de mídia (haveria emissoras de TV, canais do YouTube, filmes e séries gerados usando IA), até impactos sobre a própria comunicação online – com uma explosão na geração de vídeos forjados, dificultando ou impedindo saber o que é real ou falso.