OpenAI apresenta o GPT-4, seu novo algoritmo de inteligência artificial; Google anuncia recursos de IA para o Gmail e o Docs
Software gera respostas mais elaboradas e entende conteúdo de imagens; atualização já está online na versão paga do ChatGPT e no buscador Bing; Google mostra novas funções de IA para o Gmail e o Docs, que serão capazes de escrever mensagens e textos.
Software gera respostas mais elaboradas e entende conteúdo de imagens; atualização já está online na versão paga do ChatGPT e no buscador Bing; Google mostra novas funções de IA para o Gmail e o Docs, que serão capazes de escrever mensagens e textos
Dito e feito. Como previsto, a OpenAI apresentou hoje a nova versão do seu algoritmo de inteligência artificial: o GPT-4 (“transformador gerador pre-treinado”), que sucede o GPT-3.5 atualmente usado no robô online ChatGPT. Segundo a OpenAI, o novo algoritmo já está no ar em duas plataformas: no ChatGPT Plus, que é a versão paga do serviço (US$ 20 mensais), e no robô de conversação incluso no buscador Bing, da Microsoft. O GPT-4 também foi incorporado a aplicativos de outras empresas, como o app de idiomas Duolingo e o robô de conversação Khanmigo, do site de cursos Khan Academy.
Segundo a OpenAI, o GPT-4 é mais inteligente do que a versão atual, e “exibe performance de nível humano em vários testes acadêmicos e profissionais”. O GPT-3.5 já era capaz de passar no “bar exam”, o exame que os bacharéis em Direito devem fazer para atuar como advogados nos EUA (o equivalente americano do exame da OAB).
Mas, de acordo com a OpenAI, ele passava raspando: se fosse um aluno, estaria entre os 10% de menor pontuação. O GPT-4 inverte isso – seu desempenho fica entre os 10% de alunos mais competentes. A empresa apresentou uma tabela comparando a performance dos dois algoritmos em vários testes. Em alguns deles, como o de Direito e exames acadêmicos de economia e física, o salto é notável.
Por outro lado, o artigo científico que apresenta o GPT-4 não traz uma informação crucial: a quantidade de tokens (fragmentos de palavras) e parâmetros (relações entre as palavras) contidas no algoritmo.
Esses dados são uma medida importante do grau de complexidade dos “modelos de linguagem”, ou seja, as IAs de conversação – explicamos os motivos disso, e o crescimento dos modelos nos últimos anos, na reportagem “O futuro da IA”.
O GPT-3 contém 499 bilhões de tokens e 175 bilhões de parâmetros. Parte da expectativa em torno do GPT-4 surgiu porque se acreditava que ele poderia conter muito mais parâmetros – houve quem falasse num salto exponencial, para até 100 trilhões de parâmetros. O engenheiro Sam Altman, fundador e CEO da OpenAI, negou esse número – e disse que as pessoas estavam exagerando no hype.
A ênfase do GPT-4 pode estar no refinamento do algoritmo; não na evolução por força bruta. Mesmo assim, não informar o número de tokens e parâmetros causa algum estranhamento.
A OpenAI parece querer temperar a expectativa do público. “Numa conversação casual, a diferença entre o GPT-3.5 e o GPT-4 pode ser sutil”, afirma a empresa. “A diferença se manifesta quando a complexidade da tarefa alcança um determinado nível – o GPT-4 é mais confiável, criativo e capaz de lidar com instruções muito mais nuançadas do que o GPT-3.5”.
“Ele [o algoritmo] ainda é falho, ainda é limitado, e ainda parece mais impressionante no primeiro uso do que depois que você passa mais tempo com ele”, tuitou Altman.
Uma diferença importante é que o GPT-4 consegue trabalhar com mais texto: cada conjunto de pergunta e resposta pode ter até 25 mil palavras. É muito mais que o GPT-3, cujo limite é de aproximadamente 3.000 palavras (somando pergunta e resposta).
O GPT-4 também é capaz de analisar o conteúdo de imagens. A OpenAI apresentou alguns exemplos curiosos, como a foto abaixo. Ao ser perguntado “o que há de incomum nessa imagem?”, o algoritmo respondeu que “o incomum é que um homem está passando roupa, numa tábua de passar, presa ao teto de um táxi em movimento”.
Mas o algoritmo, pelo menos em sua versão atual, não possui o sistema de síntese de vídeos, que foi mencionado por um executivo da Microsoft na semana passada. Essa função, que já existe em outros algoritmos de IA, permite gerar vídeos a partir de prompts de texto (você descreve a cena, e a inteligência artificial gera um clipe de vídeo com ela).
O Google também apresentou novidades relacionadas à inteligência artificial: o pacote de programas online Google Workspace, que inclui o Gmail, o Google Docs, o Planilhas e o Apresentações, vai ganhar funções de IA para ajudar na criação de conteúdo.
No Docs, por exemplo, o Google mostrou o seguinte exemplo: o usuário escreve “redija uma oferta de emprego para uma vaga de representante de vendas”, e a IA faz todo o resto, gerando um post completo. Já o Gmail será capaz de criar mensagens inteiras a partir de “bullets”, ou seja, anotações de uma linha. Veja no exemplo abaixo:
O Google Apresentações também terá funções de geração de imagens com IA, que poderão ser usadas para ilustrar os slides. Os recursos começarão a ser liberados hoje, para usuários da versão paga do Workspace (que geralmente é usada em empresas).