Tecnologia

Algoritmo do Google aprende a ser lenda do xadrez em só 4 horas

A inteligência artificial AlphaZero precisou de uma única tarde para aprender tudo sobre o jogo — e derrotar o campeão mundial robótico em uma melhor de 100

Por Guilherme Eler
7 dez 2017, 19h14 • Atualizado em 11 mar 2024, 17h55

Quanto tempo você levou para gravar que um cavalo só se movimenta em L, ou que o rei pode andar duas casas de uma vez com uma ajudinha da torre? E a primeira vitória contra um oponente à altura, veio quando? Para um algoritmo de uma subsidiária da Google, aprender isso e muito mais é tarefa para algumas poucas horas. Quatro, para ser mais preciso. Foi durante esse tempo que uma inteligência artificial desenvolvida pela DeepMind conseguiu se tornar uma lenda do xadrez — e derrotar o adversário não-humano mais qualificado que alguém poderia arrumar para ela.

Se você é leitor da SUPER, talvez se lembre de que esta não é a primeira travessura ligada aos jogos de tabuleiro aprontada pela DeepMind. Essa mesma empresa de tecnologia foi responsável pela criação do AlphaGo, algoritmo que derrotou o campeão mundial de Go (jogo criado na China há mais de 2 milênios) no começo deste ano.

Tecnologia
Campeão mundial de Go perde (por muito pouco) para robô do Google

O desafio, agora, era outro. Ao invés de gravar as infinitas probabilidades de resultados do jogo chinês e disputar contra alguém de carne o osso, a ideia consistia em ensinar o computador do zero. Programado apenas com as regras do jogo, sem saber de nenhuma outra estratégia ou tática, o sistema foi submetido a uma técnica exaustiva de aprendizado de máquinas. O algoritmo deveria ensinar a si próprio a partir da repetição, jogando sozinho até ficar craque o suficiente para conseguir duelar com outros computadores. Foi assim que o AlphaGo virou AlphaZero, aspirante a Kasparov cibernético mais brilhante que se tem notícia.

O adversário escolhido foi o Stockfish, robô campeão mundial de xadrez (sim, isso existe), e a disputa aconteceu em uma melhor de 100. Dessa centena de partidas, o AlphaZero saiu invicto: venceu 28 (sendo 25 jogando com as peças brancas) e empatou 72. De acordo com a DeepMind, a diferença do robô campeão está na capacidade de processamento, mais próxima da humana. A AlphaZero consegue analisar até 80 mil posições por segundo, enquanto a capacidade da adversária, a destemida Stockfish, fica na casa das 70 mil. Haja bit para tanto cheque-mate.