Cientistas revolucionam descoberta de proteínas com IA que simula 500 milhões de anos de evolução

A IA acaba de simular 500 milhões de anos de evolução – e criou uma nova proteína!
Tecnologia de ponta cria proteína fluorescente inédita na natureza.
Um avanço extraordinário no campo da biotecnologia foi alcançado por uma equipe de pesquisadores da empresa norte-americana Evolutionary Scale, que conseguiu criar uma proteína fluorescente totalmente inédita na natureza utilizando um modelo de inteligência artificial chamado ESM3 (Evolutionary Scale Model 3). A nova proteína, denominada esmGFP, representa um marco científico significativo, pois sua criação simulou o equivalente a 500 milhões de anos de evolução natural em ambiente laboratorial. Anunciada em maio de 2025, a descoberta foi detalhada em um artigo científico publicado na prestigiada revista Science, demonstrando como a inteligência artificial está transformando profundamente nossa compreensão dos processos evolutivos e biológicos. A proteína desenvolvida pertence à família das proteínas fluorescentes verdes (Green Fluorescent Protein, ou GFP), um grupo de moléculas encontradas naturalmente em certos organismos, como algumas espécies de águas-vivas, cuja descoberta original foi tão significativa que rendeu o Prêmio Nobel de Química em 2008. O que torna a esmGFP particularmente notável é que, embora compartilhe características com proteínas fluorescentes conhecidas, sua estrutura molecular apresenta um design completamente diferente, como se a natureza tivesse seguido um caminho evolutivo alternativo que nunca ocorreu de fato.
O processo de desenvolvimento da proteína esmGFP envolveu uma metodologia inovadora que combina tecnologias de ponta em inteligência artificial com profundo conhecimento biológico. Os cientistas utilizaram o ESM3, um modelo generativo de linguagem especialmente adaptado para analisar e criar estruturas proteicas, alimentando-o com extensos dados sobre sequências e estruturas de proteínas existentes. Inicialmente, a equipe forneceu ao sistema pistas estruturais e de sequência específicas para direcionar o modelo em busca de características relacionadas à fluorescência. A partir dessas instruções, o ESM3 explorou um vasto universo de possibilidades moleculares, gerando milhares de candidatas potenciais que posteriormente passaram por rigorosos processos de filtragem e refinamento. As proteínas mais promissoras foram então sintetizadas e testadas em laboratório, culminando na validação da esmGFP em células bacterianas vivas, onde confirmaram sua capacidade fluorescente e funcionalidade. O que torna esta descoberta ainda mais extraordinária é a distância evolutiva entre a esmGFP e suas “parentes” naturais mais próximas – ela apresenta apenas 58% de identidade de sequência com seu parente natural mais próximo, uma divergência que, segundo os pesquisadores, representa mais de meio bilhão de anos de evolução. Para contextualizar a magnitude dessa diferença, quando proteínas com distâncias evolutivas semelhantes surgiram naturalmente, os dinossauros sequer existiam e a vida multicelular ainda estava em seus estágios iniciais de desenvolvimento.
As implicações desta descoberta são profundas e multifacetadas, estendendo-se muito além da criação específica da esmGFP. Em primeiro lugar, este avanço demonstra o potencial revolucionário da inteligência artificial no campo da biologia sintética, onde algoritmos podem agora não apenas analisar, mas efetivamente simular e acelerar processos evolutivos que levariam centenas de milhões de anos para ocorrer naturalmente. As proteínas fluorescentes têm aplicações cruciais em pesquisas biomédicas, sendo utilizadas como marcadores biológicos que permitem aos cientistas visualizar processos celulares em tempo real, rastrear o movimento de moléculas específicas e estudar interações proteicas complexas. A capacidade de projetar novas variantes com propriedades personalizadas abre caminho para ferramentas de diagnóstico mais precisas, tratamentos médicos inovadores e avanços significativos em técnicas de imageamento biológico. Além disso, este trabalho pioneiro estabelece um precedente metodológico que pode ser aplicado à criação de outras moléculas biologicamente ativas com funções específicas, como enzimas industriais mais eficientes, proteínas terapêuticas otimizadas ou biomateriais com propriedades únicas. A abordagem utilizada pela Evolutionary Scale representa uma convergência significativa entre os campos da inteligência artificial e da biologia molecular, onde modelos computacionais treinados com dados biológicos podem agora gerar inovações que seriam impossíveis de conceber através de métodos tradicionais de engenharia de proteínas ou evolução dirigida em laboratório.
O sucesso da criação da esmGFP sinaliza o início de uma nova era na biotecnologia, onde a barreira entre o que é natural e o que é artificialmente projetado se torna cada vez mais tênue. Especialistas sugerem que esta abordagem poderia revolucionar diversos setores, desde a medicina personalizada até a agricultura sustentável e a biorremediação ambiental. No futuro próximo, podemos esperar um aumento exponencial no desenvolvimento de proteínas sintéticas com aplicações específicas, à medida que os algoritmos de IA se tornam mais sofisticados e os pesquisadores aprimoram suas técnicas de validação e implementação biológica. Este avanço também levanta importantes questões éticas e regulatórias sobre os limites da bioengenharia e a responsabilidade científica associada à criação de moléculas que não existem naturalmente. Enquanto a comunidade científica celebra este marco extraordinário, também se prepara para navegar pelas complexas implicações de uma tecnologia que essencialmente comprime milhões de anos de evolução em ciclos de desenvolvimento que duram apenas semanas ou meses. A proteína esmGFP, brilhando com sua fluorescência verde em laboratórios ao redor do mundo, representa não apenas um triunfo da engenharia molecular, mas também um símbolo luminoso do potencial transformador da convergência entre inteligência artificial e ciências biológicas, abrindo caminho para um futuro onde o design racional de moléculas biológicas pode resolver alguns dos desafios mais prementes da humanidade.
A fusão entre IA e biologia molecular abre novos horizontes para a ciência
A criação da proteína esmGFP através da simulação de 500 milhões de anos de evolução representa apenas o começo de uma revolução científica que promete transformar profundamente nossa compreensão da vida e as possibilidades de intervenção nos sistemas biológicos. O trabalho pioneiro da Evolutionary Scale, seguindo os passos de pesquisadores como David Baker, laureado com o Prêmio Nobel de Química por seu trabalho em design computacional de proteínas, demonstra como a inteligência artificial não é apenas uma ferramenta auxiliar, mas um catalisador fundamental para descobertas científicas que antes pareciam impossíveis. À medida que estes modelos se tornam mais acessíveis e poderosos, podemos antecipar uma democratização da biologia sintética, permitindo que laboratórios ao redor do mundo desenvolvam soluções personalizadas para desafios locais e globais. O futuro próximo promete uma explosão de inovações biomoleculares, onde a linha entre o descoberto e o inventado se tornará cada vez mais fluida, e onde a própria definição do que constitui um organismo natural poderá precisar ser reconsiderada à luz dessas novas capacidades tecnológicas.