Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2022-09-28¿Ha resuelto AlphaFold el problema del plegamiento de proteínas de la biología?

Science News |Las predicciones del sistema de estructuras de millones de proteínas no son ilimitadas, dicen algunos.

Mientras la gente de todo el mundo se maravillaba en julio con las imágenes más detalladas del cosmos tomadas por el telescopio espacial James Webb, los biólogos vieron por primera vez un conjunto diferente de imágenes, que podrían ayudar a revolucionar la investigación en ciencias de la vida.

Las imágenes son las formas tridimensionales predichas de más de 200 millones de proteínas, representadas por un sistema de inteligencia artificial llamado AlphaFold. “Se puede pensar que cubre todo el universo de las proteínas”, dijo Demis Hassabis en una conferencia de prensa el 26 de julio. Hassabis es cofundador y director ejecutivo de DeepMind, la empresa con sede en Londres que creó el sistema. Combinando varias técnicas de aprendizaje profundo, el programa de computadora está capacitado para predecir formas de proteínas mediante el reconocimiento de patrones en estructuras que ya se han resuelto a través de décadas de trabajo experimental utilizando microscopios electrónicos y otros métodos.

La primera aparición de la IA se produjo en 2021, con predicciones para 350 000 estructuras de proteínas, incluidas casi todas las proteínas humanas conocidas. DeepMind se asoció con el Instituto Europeo de Bioinformática del Laboratorio Europeo de Biología Molecular para que las estructuras estén disponibles en una base de datos pública.

El nuevo lanzamiento masivo de julio amplió la biblioteca a "casi todos los organismos del planeta cuyo genoma ha sido secuenciado", dijo Hassabis. "Puede buscar una estructura tridimensional de una proteína casi tan fácilmente como hacer una búsqueda de palabras clave en Google".

Estas son predicciones, no estructuras reales. Sin embargo, los investigadores han utilizado algunas de las predicciones de 2021 para desarrollar posibles nuevas vacunas contra la malaria, mejorar la comprensión de la enfermedad de Parkinson, descubrir cómo proteger la salud de las abejas, obtener información sobre la evolución humana y más. DeepMind también ha centrado AlphaFold en enfermedades tropicales desatendidas, como la enfermedad de Chagas y la leishmaniasis, que pueden ser debilitantes o letales si no se tratan.

Expandiendo el universo de las proteínas 

Décadas de lentos experimentos han revelado la estructura de más de 194 000 proteínas, todas alojadas en el Protein Data Bank. En 2021, el proyecto AlphaFold publicó estructuras predichas para aproximadamente 1 millón de proteínas, incluidas casi todas las proteínas humanas conocidas. Este año, la base de datos AlphaFold explotó con estructuras previstas para más de 200 millones de proteínas.

Número total de estructuras proteicas identificadas y predichas

Un gráfico circular que muestra el número total de estructuras de proteínas identificadas y predichas por Protein Data Bank (más de 194 000), la base de datos AlphaFold en 2021 (~1 millón) y la base de datos AlphaFold actual (más de 200 millones). T. TIBBITTS

Muchos científicos recibieron con entusiasmo la publicación del vasto conjunto de datos. Pero a otros les preocupa que los investigadores tomen las estructuras predichas como las verdaderas formas de las proteínas. Todavía hay cosas que AlphaFold no puede hacer, y no fue diseñado para hacer, que deben abordarse antes de que el cosmos de proteínas se enfoca por completo.

Tener el nuevo catálogo abierto para todos es "un gran beneficio", dice Julie Forman-Kay, biofísica de proteínas en el Hospital for Sick Children y la Universidad de Toronto. En muchos casos, AlphaFold y RoseTTAFold, otros investigadores de IA que están entusiasmados, predicen formas que coinciden bien con los perfiles de proteínas de los experimentos. Pero, advierte, "no es así en todos los ámbitos".

Las predicciones son más precisas para algunas proteínas que para otras. Las predicciones erróneas podrían hacer que algunos científicos piensen que entienden cómo funciona una proteína cuando en realidad no es así. Los minuciosos experimentos siguen siendo cruciales para comprender cómo se pliegan las proteínas, dice Forman-Kay. "Existe la sensación ahora de que las personas no tienen que hacer una determinación experimental de la estructura, lo cual no es cierto".
F20H23.2

Modelo predicho de F20H23.2. MENTE PROFUNDA. Organismo fuente: Berro de Thale (Arabidopsis thaliana)

Importancia:

Esta proteína vegetal es una quinasa, que agrega fosfatos a otras moléculas, cambiando potencialmente sus funciones.

NOTA: EL NIVEL DE CONFIANZA DE LAS PREDICCIONES DE ALPHAFOLD VARÍA DENTRO DE CADA PROTEÍNA. LAS REGIONES AZUL OSCURO Y AZUL CLARO EN UNA ESTRUCTURA PREDICHA SIGNIFICAN QUE EL ALGORITMO ES RELATIVAMENTE SEGURO. LAS PREDICCIONES MENOS SEGURAS SON DE COLOR AMARILLO Y NARANJA.

Progreso laborioso

Las proteínas comienzan como largas cadenas de aminoácidos y se pliegan en una gran cantidad de florituras y otras formas tridimensionales. Algunos se asemejan a los apretados tirabuzones de una permanente de los 80 o los pliegues de un acordeón. Otros podrían confundirse con los garabatos en espiral de un niño.

La arquitectura de una proteína es más que solo estética; puede determinar cómo funciona esa proteína. Por ejemplo, las proteínas llamadas enzimas necesitan un bolsillo donde puedan capturar pequeñas moléculas y llevar a cabo reacciones químicas. Y las proteínas que funcionan en un complejo de proteínas, dos o más proteínas que interactúan como partes de una máquina, necesitan las formas correctas para encajar en la formación con sus socios.

Conocer los pliegues, espirales y bucles de la forma de una proteína puede ayudar a los científicos a descifrar cómo, por ejemplo, una mutación altera esa forma para causar una enfermedad. Ese conocimiento también podría ayudar a los investigadores a fabricar mejores vacunas y medicamentos.

Durante años, los científicos han bombardeado cristales de proteínas con rayos X, han congelado células y las han examinado con microscopios electrónicos de alta potencia, y han utilizado otros métodos para descubrir los secretos de las formas de las proteínas. Tales métodos experimentales toman “mucho tiempo del personal, mucho esfuerzo y mucho dinero. Así que ha sido lento”, dice Tamir Gonen, biofísico de membranas e investigador del Instituto Médico Howard Hughes en la Escuela de Medicina David Geffen de la UCLA.

proteína de nucleación de hielomodelo predicho de la proteína de nucleación de hieloMENTE PROFUNDA

Organismo fuente: Bacteria Pseudomonas ( Pseudomonas syringae )

Importancia:

Da lugar a daños por heladas en las plantas al desencadenar cristales de hielo a temperaturas relativamente altas. Podría usarse para sembrar nubes y conservar alimentos.

Un trabajo experimental tan meticuloso y costoso ha descubierto las estructuras tridimensionales de más de 194 000 proteínas, cuyos archivos de datos se almacenan en el Protein Data Bank, respaldado por un consorcio de organizaciones de investigación. Pero el ritmo acelerado al que los genetistas están descifrando las instrucciones del ADN para hacer proteínas ha superado con creces la capacidad de los biólogos estructurales para mantenerse al día, dice el biólogo de sistemas Nazim Bouatta de la Facultad de Medicina de Harvard. “La pregunta para los biólogos estructurales era, ¿cómo cerramos la brecha?” él dice.

Para muchos investigadores, el sueño ha sido tener programas de computadora que pudieran examinar el ADN de un gen y predecir cómo la proteína que codifica se plegaría en una forma tridimensional.

Aquí viene AlphaFold

Durante muchas décadas, los científicos progresaron hacia ese objetivo de IA. Pero “hasta hace dos años, estábamos muy lejos de encontrar una buena solución”, dice John Moult, biólogo computacional del campus de Rockville de la Universidad de Maryland.

Moult es uno de los organizadores de una competencia: la Evaluación crítica de la predicción de la estructura de proteínas, o CASP. Los organizadores dan a los competidores un conjunto de proteínas para que sus algoritmos las plieguen y comparen las predicciones de las máquinas con estructuras determinadas experimentalmente. La mayoría de las IA no lograron acercarse a las formas reales de las proteínas.

"La estructura no te dice todo sobre cómo funciona una proteína".
Jane Dyson

Luego, en 2020, AlphaFold apareció a lo grande, prediciendo las estructuras del 90 por ciento de las proteínas de prueba con alta precisión, incluidos dos tercios con una precisión que rivaliza con los métodos experimentales.

Descifrar la estructura de proteínas individuales había sido el núcleo de la competencia CASP desde su inicio en 1994. Con el desempeño de AlphaFold, "de repente, eso estaba hecho", dice Moult.

Desde el lanzamiento de AlphaFold en 2021, más de medio millón de científicos han accedido a su base de datos, dijo Hassabis en la rueda de prensa. Algunos investigadores, por ejemplo, han usado las predicciones de AlphaFold para ayudarlos a estar más cerca de completar un enorme rompecabezas biológico: el complejo de poros nucleares. Los poros nucleares son portales clave que permiten que las moléculas entren y salgan de los núcleos celulares. Sin los poros, las células no funcionarían correctamente. Cada poro es enorme, relativamente hablando, compuesto por unas 1.000 piezas de unas 30 proteínas diferentes. Los investigadores habían logrado previamente colocar alrededor del 30 por ciento de las piezas del rompecabezas.

El poro nuclear

Los investigadores resolvieron previamente alrededor del 30 por ciento del rompecabezas de 1000 piezas que es el complejo del poro nuclear. AlphaFold ayudó a dar sentido a los datos experimentales para completar el 60 por ciento de la estructura.

Ilustración que muestra el modelo anterior del complejo de poros nucleares junto al modelo actual, que parece ser significativamente más grande. S. MOSALAGANTI ET AL/CIENCIA 2022

Ese rompecabezas ahora está completo en casi un 60 por ciento , después de combinar las predicciones de AlphaFold con técnicas experimentales para comprender cómo encajan las piezas, informaron los investigadores en Science el 10 de junio .

Ahora que AlphaFold prácticamente ha resuelto cómo plegar proteínas individuales, los organizadores de CASP de este año están pidiendo a los equipos que trabajen en los próximos desafíos: predecir las estructuras de las moléculas de ARN y modelar cómo las proteínas interactúan entre sí y con otras moléculas.

Para ese tipo de tareas, dice Moult, los métodos de inteligencia artificial de aprendizaje profundo “parecen prometedores pero aún no han dado los frutos”.

Donde la IA se queda corta

Ser capaz de modelar las interacciones de proteínas sería una gran ventaja porque la mayoría de las proteínas no funcionan de forma aislada. Trabajan con otras proteínas u otras moléculas en las células. Pero la precisión de AlphaFold para predecir cómo podrían cambiar las formas de dos proteínas cuando las proteínas interactúan "no se acerca" a la de sus proyecciones puntuales para una gran cantidad de proteínas individuales, dice Forman-Kay, biofísico de proteínas de la Universidad de Toronto. Eso es algo que los creadores de AlphaFold también reconocen.

La IA se entrenó para plegar proteínas examinando los contornos de estructuras conocidas. Y se han resuelto experimentalmente muchos menos complejos multiproteicos que proteínas individuales.

Forman-Kay estudia proteínas que se niegan a ser confinadas a una forma particular. Estas proteínas intrínsecamente desordenadas suelen ser tan blandas como fideos húmedos (SN: 9/2/13, p. 26). Algunos se plegarán en formas definidas cuando interactúen con otras proteínas o moléculas. Y pueden plegarse en nuevas formas cuando se combinan con diferentes proteínas o moléculas para realizar diversos trabajos.

Las formas predichas de AlphaFold alcanzan un alto nivel de confianza para alrededor del 60 por ciento de las proteínas onduladas que examinaron Forman-Kay y sus colegas, informó el equipo en un estudio preliminar publicado en febrero en bioRxiv.org. A menudo, el programa representa a los cambia formas como largos sacacorchos llamados hélices alfa.

El grupo de Forman-Kay comparó las predicciones de AlphaFold para tres proteínas desordenadas con datos experimentales. La estructura que la IA asignó a una proteína llamada alfa-sinucleína se parece a la forma que toma la proteína cuando interactúa con los lípidos, encontró el equipo. Pero esa no es la apariencia de la proteína todo el tiempo.

Para otra proteína, llamada proteína 2 de unión al factor de iniciación de la traducción eucariótica 4E, AlphaFold predijo una mezcla de las dos formas de la proteína cuando se trabaja con dos socios diferentes. Esa estructura de Frankenstein, que no existe en los organismos reales, podría confundir a los investigadores sobre cómo funciona la proteína, dicen Forman-Kay y sus colegas.

AlphaFold también puede ser demasiado rígido en sus predicciones. Una "estructura estática no te dice todo sobre cómo funciona una proteína", dice Jane Dyson, bióloga estructural del Instituto de Investigación Scripps en La Jolla, California. Incluso las proteínas individuales con estructuras generalmente bien definidas no se congelan en el espacio. Las enzimas, por ejemplo, sufren pequeños cambios de forma cuando conducen reacciones químicas.

Si le pide a AlphaFold que prediga la estructura de una enzima, mostrará una imagen fija que puede parecerse mucho a lo que los científicos han determinado mediante cristalografía de rayos X, dice Dyson. “Pero [no] mostrará ninguna de las sutilezas que están cambiando a medida que los diferentes socios” interactúan con la enzima.

“La dinámica es lo que el Sr. AlphaFold no puede brindarle”, dice Dyson.

Una revolución en ciernes

Las representaciones por computadora les dan a los biólogos una ventaja para resolver problemas tales como cómo un fármaco podría interactuar con una proteína. Pero los científicos deben recordar una cosa: "Estos son modelos", no estructuras descifradas experimentalmente, dice Gonen, de la UCLA.

Utiliza las predicciones de proteínas de AlphaFold para ayudar a dar sentido a los datos experimentales, pero le preocupa que los investigadores acepten las predicciones de la IA como un evangelio. Si eso sucede, "el riesgo es que se vuelva más y más difícil justificar por qué necesitas resolver una estructura experimental". Eso podría conducir a una reducción de la financiación, el talento y otros recursos para los tipos de experimentos necesarios para comprobar el trabajo de la computadora y abrir nuevos caminos, dice.

Bouatta, de la Escuela de Medicina de Harvard, es más optimista. Él piensa que los investigadores probablemente no necesitan invertir recursos experimentales en los tipos de proteínas que AlphaFold hace un buen trabajo de predicción, lo que debería ayudar a los biólogos estructurales a clasificar dónde poner su tiempo y dinero.

“Hay proteínas por las que AlphaFold todavía está luchando”, está de acuerdo Bouatta. Los investigadores deberían gastar su capital allí, dice. "Tal vez si generamos más datos [experimentales] para esas proteínas desafiantes, podríamos usarlos para volver a entrenar otro sistema de IA" que podría hacer predicciones aún mejores.

Él y sus colegas ya han realizado ingeniería inversa de AlphaFold para hacer una versión llamada OpenFold que los investigadores pueden entrenar para resolver otros problemas, como esos complejos de proteínas retorcidos pero importantes.

Cantidades masivas de ADN generadas por el Proyecto Genoma Humano han hecho posible una amplia gama de descubrimientos biológicos y han abierto nuevos campos de investigación (SN: 2/12/22, p. 22). Tener información estructural sobre 200 millones de proteínas podría ser igualmente revolucionario, dice Bouatta.

En el futuro, gracias a AlphaFold y sus parientes de IA, dice, "ni siquiera sabemos qué tipo de preguntas podríamos estar haciendo".

CITAS

DeepMind y EMBL-EBI. AlphaFold predice la estructura de casi todas las proteínas catalogadas conocidas por la ciencia. Publicado el 28 de julio de 2022.

S. Mosalaganti et al. La predicción de estructuras basada en IA permite el análisis estructural integrador de los poros nucleares humanos. ciencia _ vol. 376, 10 de junio de 2022, pág. 6598. doi:10.1126/science.abm9506.

K.-T. Ko et al. Estructura del candidato a vacuna contra la malaria Pfs48/45 y su reconocimiento por anticuerpos bloqueadores de la transmisión. bioRxiv.org. 25 de mayo de 2022. doi:10.1101/2022.05.24.493318.

TR Alderson et al. Identificación sistemática de regiones intrínsecamente desordenadas plegadas condicionalmente por AlphaFold2. bioRxiv.org. 18 de febrero de 2022. doi:10.1101/2022.02.18.481080.

J. Jumper et al. Predicción altamente precisa de la estructura de proteínas con AlphaFold. naturaleza _ vol. 596, 15 de julio de 2021, pág. 583. doi:10.1038/s41586-021-03819-2.

M. Baek, et al. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres vías. ciencia _ Publicado en línea el 15 de julio de 2021. doi: 10.1126/science.abj8754.


Sobre Tina Hesman Saey

Tina Hesman Saey es redactora sénior e informa sobre biología molecular. Ella tiene un doctorado. en genética molecular de la Universidad de Washington en St. Louis y una maestría en periodismo científico de la Universidad de Boston.

Science News
Autor
Science News

Durante casi un siglo, los periodistas de Science News han cubierto avances en ciencia, medicina y tecnología para el público en general, incluido el ensayo del "mono" de Scopes de 1925, el advenimiento de la era atómica en 1945, la carrera espacial y la revolución de la ingeniería genética, desde el descubrimiento del ADN hasta la tecnología actual de edición de genes. En apoyo de nuestra misión de servir al interés público al brindar una cobertura precisa e imparcial de noticias en ciencia, medicina y tecnología, seguimos estándares ampliamente reconocidos de periodismo desarrollados y adheridos por las principales organizaciones de noticias. Eso incluye ser honestos y transparentes en nuestro trabajo y en nuestras interacciones con fuentes y lectores.


2022-11-26
Hallan genes bacterianos que eliminarían residuos textiles en las aguas

Mucha de la ropa que usted se pone y que en unos años seguro va a desechar o a cambiar, terminará siendo botada al mar, lo cual es problemático porque sus materiales tienen compuestos químicos que impactan la salud del agua. Una bacteria marina llamada Achromobacter denitrificans parece tener dentro de sí la clave para reducir el impacto en la contaminación de los residuos textiles.

2022-11-25
Diseñan un recubrimiento antibacterias para proteger las superficies de acero inoxidable

Un equipo de investigación del Instituto de Ciencia de Materiales de Sevilla (ICMSE-CSIC) ha desarrollado una capa nanoestructurada en forma de columnas que mejora la capacidad anticorrosiva de este metal y frena su deterioro. Los expertos proponen emplearla como revestimiento para instrumental sanitario o electrodomésticos.

2022-11-25
La tecnología del ARNm nos libró del COVID: ahora se ha propuesto salvarnos de la gripe definitivamente

Según la Organización Mundial de la Salud, cada año, hasta 650.000 personas mueren por enfermedades respiratorias relacionadas con la gripe estacional. 650.000 personas cada año y pese a ello, seguimos sin ser capaces de crear una vacuna realmente universal contra la gripe. Al menos hasta hoy: cuando una vacuna basada en ARN mensajero puede cambiarlo todo.

2022-11-24
México: altos niveles de aluminio y otros contaminantes en presa Madín

Las personas que se abastecen de la presa Madín, ubicada en la zona Metropolitana de México, una de las más pobladas del país, están expuestas a estrés oxidativo, debido a la presencia de diversas sustancias minerales como el aluminio.

2022-11-22
Unos 300 identificarán los patógenos que pueden desencadenar pandemias, entre ellos el de la Enfermedad X

De esa forma, la agencia de la salud de la ONU actualizará la lista de patógenos prioritarios, una herramienta que sirve para dar una respuesta rápida ante cualquier posibilidad de que se produzca una pandemia.

2022-11-21
Mecanoquímica: la industria sostenible del mañana

La Mecanoquímica es una de las ciencias más antiguas empleada por la humanidad. Como se deduce del nombre, se basa en el concepto de que la energía mecánica ejercida sobre un material produce transformaciones químicas y aporta cambios físicos al mismo.