Inteligência artificial aprende a jogar 57 jogos de Atari melhor que humanos
Em todos eles, a ferramenta teve um desempenho melhor do que um usuário comum teria. Entenda o que a façanha significa.
Pitfall, Space Invaders, Donkey Kong, Pac-man. Milhares de crianças dos anos 1980 gastaram horas a fio frente à TV tentando chegar ao final desses e outros títulos do Atari 2600 – um dos videogames mais populares da história. Enquanto muitos provavelmente não conseguiram cumprir de cabo a rabo um único jogo sequer, uma inteligência artificial zerou (com pontuação máxima) todos os 57 games lançados para a plataforma entre 1977 e 1990. Não à toa, a ferramenta em questão foi batizada Agent57.
Em todos os jogos, o score final da máquina era sempre maior que o número de pontos que um jogador médio somaria. Segundo destaca um artigo científico publicado na plataforma arXiV, a Agent57 é a primeira inteligência artificial já criada a superar o desempenho de um usuário típico. E em alguns deles, inclusive, a IA mostrou que ganharia de lavada até mesmo de um jogador de carne e osso bem treinado. Isso aconteceu em títulos como o clássico Pitfall, Montezuma’s Revenge, Solaris e Skiing, por exemplo.
Mas qual o propósito de fazer um robô do tipo – além de jogar em nossa cara a superioridade das máquinas em tarefas de lógica e habilidade? Testar IAs usando jogos é uma boa forma de expandir seus limites, fazendo com que elas sejam aprimoradas em aspectos em que ainda não são tão precisas. E pra que isso serve? Bem, é só imaginar o potencial de um algoritmo que não fosse excelente apenas em executar uma sequência de tarefas rapidamente – mas também em ler informações do ambiente e adaptar estratégias quando necessário.
Desafios de jogos de videogame muitas vezes exigem do computador a capacidade de analisar cenários e identificar estratégias que estão fadadas a dar errado – algo que outras tarefas mais mecânicas, com menos espaço para improviso, dificilmente explorariam tão bem. É o famoso jeitinho.
Como destaca a revista MIT Technology Review, títulos como Pitfall e Montezuma’s Revenge – ambos jogos de plataforma – obrigavam a inteligência artificial a experimentar, explorando cenários de novas formas para ganhar o maior número de pontos possível.
Já games como Solaris (de combate espacial) e Skiing (em que o pratagonista é um esquiador), que demandam movimentos e mudanças de rumo rápidas, cobram algo diferente. Em jogos do tipo, benefícios de curto prazo (como desviar de um obstáculo para pegar um prêmio) costumam valer menos que os de longo prazo. Isso costuma ser algo difícil de um robô entender, já que o objetivo final é o de somar mais pontos a todo custo. Quando expostas a cenários do tipo, IAs têm menos certeza do caminho que estão tomando – o que as obriga estar constantemente corrigindo rotas e avaliando o impacto de cada movimento. Abaixo, você pode assistir a uma palhinha da Agent57 esquiando.
A ferramenta Agent 57 foi uma criação da DeepMind, empresa de IA do Reino Unido vinculada à Google. Não é a primeira vez que um projeto da DeepMind coloca os humanos para comer poeira em algum jogo. O sistema de aprendizado de máquina AlphaGo, outra criação da empresa, chegou a derrotar o campeão mundial de Go – jogo de tabuleiro chinês milenar – em março de 2016. Outra criação da DeepMind, a MuZero, já tinha superado humanos em 51 jogos de Atari.
Apesar das habilidades impressionantes, há, no entanto, um quesito em que a Agent57 ainda fica atrás dos humanos: a versatilidade. Ela consegue resultados excelentes nos 57 jogos, é verdade. Mas só consegue jogar com excelência um de cada vez. Ponto para as crianças dos anos 1980.