banner_de_páxina

noticias

O Premio Lasker de Investigación Médica Básica deste ano foi outorgado a Demis Hassabis e John Jumper polas súas contribucións á creación do sistema de intelixencia artificial AlphaFold, que predí a estrutura tridimensional das proteínas baseándose na secuencia de primeira orde de aminoácidos.

 

Os seus resultados resolven un problema que leva moito tempo preocupando á comunidade científica e abren a porta a acelerar a investigación no campo biomédico. As proteínas desempeñan un papel fundamental no desenvolvemento de enfermidades: na enfermidade de Alzheimer, préganse e agrúpanse; no cancro, pérdese a súa función reguladora; nos trastornos metabólicos conxénitos, son disfuncionais; na fibrose quística, van ao espazo equivocado da célula. Estes son só algúns dos moitos mecanismos que causan enfermidades. Os modelos detallados da estrutura das proteínas poden proporcionar configuracións atómicas, impulsar o deseño ou a selección de moléculas de alta afinidade e acelerar o descubrimento de fármacos.

 

As estruturas das proteínas determínanse xeralmente mediante cristalografía de raios X, resonancia magnética nuclear e criomicroscopía electrónica. Estes métodos son caros e requiren moito tempo. Isto dá lugar a bases de datos de estruturas de proteínas en 3D existentes con só uns 200.000 datos estruturais, mentres que a tecnoloxía de secuenciación de ADN produciu máis de 8 millóns de secuencias de proteínas. Na década de 1960, Anfinsen et al. descubriron que a secuencia unidimensional de aminoácidos pode pregarse espontaneamente e repetitivamente nunha conformación tridimensional funcional (Figura 1A) e que as "chaperonas" moleculares poden acelerar e facilitar este proceso. Estas observacións levan a un desafío de 60 anos na bioloxía molecular: predicir a estrutura tridimensional das proteínas a partir da secuencia unidimensional de aminoácidos. Co éxito do Proxecto Xenoma Humano, a nosa capacidade para obter secuencias de aminoácidos unidimensionais mellorou moito, e este desafío volveuse aínda máis urxente.

Estrutura da proteína ST6GAL1

Predicir as estruturas das proteínas é difícil por varias razóns. En primeiro lugar, todas as posibles posicións tridimensionais de cada átomo en cada aminoácido requiren moita exploración. En segundo lugar, as proteínas aproveitan ao máximo a complementariedade na súa estrutura química para configurar os átomos de forma eficiente. Dado que as proteínas adoitan ter centos de "doantes" de enlaces de hidróxeno (xeralmente osíxeno) que deberían estar preto do "aceptor" de enlaces de hidróxeno (xeralmente nitróxeno unido ao hidróxeno), pode ser moi difícil atopar conformacións onde case todos os doantes estean preto do aceptor. En terceiro lugar, hai exemplos limitados para o adestramento de métodos experimentais, polo que é necesario comprender as posibles interaccións tridimensionais entre os aminoácidos baseándose en secuencias unidimensionais utilizando información sobre a evolución das proteínas relevantes.

 

A física empregouse por primeira vez para modelar a interacción dos átomos na procura da mellor conformación e desenvolveuse un método para predicir a estrutura das proteínas. Karplus, Levitt e Warshel recibiron o Premio Nobel de Química en 2013 polo seu traballo sobre a simulación computacional de proteínas. Non obstante, os métodos baseados na física son computacionalmente caros e requiren un procesamento aproximado, polo que non se poden predicir estruturas tridimensionais precisas. Outra abordaxe "baseada no coñecemento" consiste en usar bases de datos de estruturas e secuencias coñecidas para adestrar modelos mediante intelixencia artificial e aprendizaxe automática (IA-ML). Hassabis e Jumper aplican elementos tanto da física como da IA-ML, pero a innovación e o salto no rendemento da abordaxe derivan principalmente da IA-ML. Os dous investigadores combinaron creativamente grandes bases de datos públicas con recursos informáticos de nivel industrial para crear AlphaFold.

 

Como sabemos que "resolveron" o crebacabezas da predición estrutural? En 1994, estableceuse o concurso Critical Assessment of Structure Prediction (CASP), que se reúne cada dous anos para seguir o progreso da predición estrutural. Os investigadores compartirán a secuencia 1D da proteína cuxa estrutura resolveron recentemente, pero cuxos resultados aínda non foron publicados. O preditor predí a estrutura tridimensional usando esta secuencia 1D, e o avaliador xulga de forma independente a calidade dos resultados preditos comparándoos coa estrutura tridimensional proporcionada polo experimentador (proporcionada só ao avaliador). O CASP realiza revisións cegas reais e rexistra saltos de rendemento periódicos asociados coa innovación metodolóxica. Na 14ª Conferencia CASP en 2020, os resultados da predición de AlphaFold mostraron un salto de rendemento tal que os organizadores anunciaron que o problema da predición da estrutura 3D fora resolto: a precisión da maioría das predicións era próxima á das medicións experimentais.

 

A importancia máis ampla é que o traballo de Hassabis e Jumper demostra de xeito convincente como a IA-ML podería transformar a ciencia. A súa investigación amosa que a IA-ML pode construír hipóteses científicas complexas a partir de múltiples fontes de datos, que os mecanismos de atención (semellantes aos de ChatGPT) poden descubrir dependencias e correlacións clave nas fontes de datos e que a IA-ML pode autoxulgar a calidade dos seus resultados. A IA-ML é esencialmente facer ciencia.


Data de publicación: 23 de setembro de 2023