Predicción computacional de proteínas intrínsecamente desordenadas basada en secuencias proteicas y redes neuronales convolucionales
Autores: Hao, He; Yong, Yang
Idioma: Inglés
Editor: Hindawi
Año: 2021
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
propiedad evolutiva
residuos centrales
red neuronal convolucional
combinació
n de secuencia
estructura estable ú
nica
idp
especificidad de secuencia
papel importante
cnn construida
matriz de caracterí
sticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Las proteínas intrínsecamente desordenadas (IDPs) poseen al menos una región que carece de una única estructura estable in vivo, lo que hace que desempeñen un papel importante en una variedad de funciones biológicas. Proponemos un método de predicción para IDPs basado en redes neuronales convolucionales (CNNs) y en la selección de características. Se utiliza la combinación de propiedades de secuencia y evolución para describir las diferencias entre las regiones desordenadas y las ordenadas. Especialmente, para destacar la correlación entre el residuo objetivo y los residuos adyacentes, se seleccionan múltiples ventanas para preprocesar la secuencia de la proteína a través de las propiedades seleccionadas. Las ventanas más cortas reflejan las características del residuo central, y las ventanas más largas reflejan las características de los alrededores del residuo central. Además, para destacar la especificidad de la secuencia y las propiedades evolutivas, se preprocesan, respectivamente. Después, las propiedades preprocesadas se combinan en matrices de características como entrada de la CNN construida. Nuestro método se entrena y se prueba a partir de la base de datos DisProt. Los resultados de la simulación muestran que el método propuesto puede predecir los IDPs de forma efectiva, y el rendimiento es competitivo en comparación con IsUnstruct y ESpritz.
Descripción
Las proteínas intrínsecamente desordenadas (IDPs) poseen al menos una región que carece de una única estructura estable in vivo, lo que hace que desempeñen un papel importante en una variedad de funciones biológicas. Proponemos un método de predicción para IDPs basado en redes neuronales convolucionales (CNNs) y en la selección de características. Se utiliza la combinación de propiedades de secuencia y evolución para describir las diferencias entre las regiones desordenadas y las ordenadas. Especialmente, para destacar la correlación entre el residuo objetivo y los residuos adyacentes, se seleccionan múltiples ventanas para preprocesar la secuencia de la proteína a través de las propiedades seleccionadas. Las ventanas más cortas reflejan las características del residuo central, y las ventanas más largas reflejan las características de los alrededores del residuo central. Además, para destacar la especificidad de la secuencia y las propiedades evolutivas, se preprocesan, respectivamente. Después, las propiedades preprocesadas se combinan en matrices de características como entrada de la CNN construida. Nuestro método se entrena y se prueba a partir de la base de datos DisProt. Los resultados de la simulación muestran que el método propuesto puede predecir los IDPs de forma efectiva, y el rendimiento es competitivo en comparación con IsUnstruct y ESpritz.