Nobel de Química vai para cientistas que revolucionaram o estudo das proteínas com IA
Entenda como computadores podem criar novas proteínas e prever suas funções – e como essa tecnologia já está sendo usada no Brasil.
O Prêmio Nobel de Química de 2024 será dividido entre três cientistas, laureados por suas pesquisas que utilizam computadores para criar novas proteínas ou prever suas estruturas 3D a partir de sequências de aminoácidos.
David Baker, da Universidade de Washington em Seattle, nos Estados Unidos, e Demis Hassabis e John M. Jumper, da DeepMind, empresa de IA do Google, revolucionaram o mundo das proteínas, as ferramentas químicas que fazem a vida acontecer.
O prêmio de 11 milhões de coroas suecas (quase R$ 6 milhões) foi anunciado pela Academia Real Sueca de Ciências nesta quarta-feira, 9. Metade dele vai para Baker, e a outra metade vai ser dividida entre Hassabis e Jumper.
Entenda as descobertas
As proteínas são “os trabalhadores da célula”, de acordo com Mario Murakami, pesquisador do Centro Nacional de Pesquisa em Energia e Materiais (CNPEM) e membro da Academia Brasileira de Ciências.
Essas macromoléculas participam da “vasta maioria das atividades biológicas” em qualquer célula de qualquer organismo. Geração de energia, metabolismo de carboidrato e lipídios… todo o processo de transcrição do DNA e tradução do RNA para realizar a síntese proteica é assessorado por proteínas.
Proteínas são compostas por conjuntos de 20 moléculas orgânicas chamadas aminoácidos.Em 2003, David Baker e sua equipe conseguiram criar uma proteína do zero, projetando no computador uma macromolécula que não existe na natureza.
Ele já foi responsável pela criação de várias proteínas ab initio, termo científico para designar o processo de criar essas macromoléculas sintéticas do zero. As novas proteínas podem ser usadas de muitas maneiras – remédios, vacinas, materiais sintéticos – e em qualquer área que envolva a biologia, não só na saúde.
É um processo de “aceleração da evolução”, como explica Murakami. Proteínas que poderiam levar milhares de anos para surgir naturalmente pelo processo de evolução, agora podem ser sintetizadas em laboratório.
A função de cada proteína é definida por sua estrutura tridimensional. Os cientistas dizem que elas se enovelam, com as cadeias de aminoácidos se dobrando e enrolando. É como um novelo de lã de aminoácidos que pode se configurar em um belo cachecol, ou touca, ou meia.
Agora, imagine que você tem um novelo de lã na sua frente. Não dá para saber o que ele vai virar. Quem decide isso é quem vai tricotar. A mesma coisa é verdade para as proteínas: descobrir qual vai ser a estrutura – ou seja, a função – é quase impossível só olhando para a cadeia de aminoácidos.
Experimentos complexos eram feitos para descobrir o enovelamento da proteína a partir dos aminoácidos que a formam, levando semanas, meses, talvez até anos. Agora, com o modelo de inteligência artificial de Demis Hassabis e John Jumper, dá para “predizer o enovelamento a partir da sequência de aminoácidos em minutos e horas, com alta precisão”, explica Murakami.
O AlphaFold2, modelo de IA desenvolvido pela DeepMind, foi lançado em 2020 e realizou um sonho científico que existia desde a década de 1970: prever a estrutura de uma proteína com base nas sequências de aminoácidos que a formam. Usando essa ferramenta, Hassabis e Jumper já conseguiram prever a estrutura de praticamente todas as 200 milhões de proteínas já identificadas.
Essa é uma tecnologia que já foi usada por mais de dois milhões de pessoas em 190 países diferentes. As aplicações das descobertas são inúmeras, desde a criação de novos medicamentos e o estudo do câncer até a compreensão mais profunda das proteínas, esse proletariado orgânico que faz nosso corpo funcionar.
Na prática, aqui no Brasil
“A gente faz o uso rotineiro desses programas no CNPEM”, explica Mario Murakami. O centro de estudos tem se dedicado a estudar a transição do Brasil para a bioeconomia, um modelo de produção mais sustentável, usando recursos biológicos renováveis e uma base energética limpa.
Os cientistas do CNPEM descobriram uma enzima que produz hidrocarbonetos – os compostos químicos usados na indústria para fabricar plásticos e presentes no petróleo e no carvão – a partir de resíduos agroindustriais.
Essa proteína brasileira, descrita neste estudo publicado na PNAS, foi usada como exemplo pelo vencedor do Nobel, David Baker, em seu último artigo, publicado na Science.
O CNPEM se dedica a pesquisar a biodiversidade de vida microbiana nos seis biomas do Brasil. Na maioria dos casos, os objetos de estudos dos cientistas do CNPEM são “microrganismos desconhecidos com proteínas de função desconhecida”.
Essas proteínas desconhecidas têm um grande potencial biotecnológico. As suas funções podem ajudar a revolucionar a agricultura, a medicina e os biocombustíveis, e elas são descobertas usando os modelos computacionais dos vencedores do Nobel.
Murakami conta que os genes desconhecidos são chamados de “matéria escura microbiana”. Tendo a estrutura dessas proteínas, e não só a sequência de aminoácidos, eles aceleram a velocidade de descoberta. Isso ajuda a analisar mais proteínas, chegando mais facilmente naquelas com grande potencial biotecnológico.
O Nobel de Física de 2024 também premiou projetos e descobertas relacionados à inteligência artificial, com cientistas precursores na criação de redes neurais artificiais e no aprendizado de máquina. Para saber mais, é só ler aqui.
Depois de receber a notícia do prêmio, Hassabis disse ao site do Nobel que a IA é uma ferramenta poderosa, mas não uma substituta para os cientistas humanos. “Esses sistemas são muito bons para analisar dados e encontrar padrões e estruturas, mas eles não podem descobrir qual é a pergunta certa a se fazer, ou qual a melhor hipótese.”