Predicción de Interacciones Proteína-Proteína Basada en un Modelo de Aprendizaje por Conjuntos a Partir de la Secuencia de Proteínas
Autores: Zhan, Xinke; Xiao, Mang; You, Zhuhong; Yan, Chenggang; Guo, Jianxin; Wang, Liping; Sun, Yaoqi; Shang, Bingwan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Las interacciones proteína-proteína (PPIs) juegan un papel esencial en muchas funciones celulares biológicas. Sin embargo, todavía es tedioso y consume mucho tiempo identificar interacciones proteína-proteína a través de métodos experimentales tradicionales. Por esta razón, es imperativo y necesario desarrollar un método computacional para predecir PPIs de manera eficiente. Este artículo explora un nuevo método computacional para detectar PPIs a partir de la secuencia de proteínas, el enfoque que adopta principalmente el método de extracción de características: Proyecciones que Preservan la Localidad (LPP) y el clasificador: Bosque de Rotación (RF). Específicamente, primero empleamos la Matriz de Puntuación Específica de Posición (PSSM), que puede mantener información evolutiva biológica para representar la secuencia de proteínas de manera eficiente. Luego, se aplica el descriptor LPP para extraer vectores de características de PSSM. Los vectores de características se introducen en el RF para obtener los resultados finales. El método propuesto se aplica a dos conjuntos de datos y obtuvo una precisión promedio del 92.81% y 92.56%, respectivamente. También lo comparamos con vecinos más cercanos (KNN) y máquinas de soporte vectorial (SVM) para evaluar mejor el rendimiento del método propuesto. En resumen, todos los resultados experimentales indican que el enfoque propuesto es estable y robusto para predecir PPIs y promete ser una herramienta útil para la investigación en proteómica.
Descripción
Las interacciones proteína-proteína (PPIs) juegan un papel esencial en muchas funciones celulares biológicas. Sin embargo, todavía es tedioso y consume mucho tiempo identificar interacciones proteína-proteína a través de métodos experimentales tradicionales. Por esta razón, es imperativo y necesario desarrollar un método computacional para predecir PPIs de manera eficiente. Este artículo explora un nuevo método computacional para detectar PPIs a partir de la secuencia de proteínas, el enfoque que adopta principalmente el método de extracción de características: Proyecciones que Preservan la Localidad (LPP) y el clasificador: Bosque de Rotación (RF). Específicamente, primero empleamos la Matriz de Puntuación Específica de Posición (PSSM), que puede mantener información evolutiva biológica para representar la secuencia de proteínas de manera eficiente. Luego, se aplica el descriptor LPP para extraer vectores de características de PSSM. Los vectores de características se introducen en el RF para obtener los resultados finales. El método propuesto se aplica a dos conjuntos de datos y obtuvo una precisión promedio del 92.81% y 92.56%, respectivamente. También lo comparamos con vecinos más cercanos (KNN) y máquinas de soporte vectorial (SVM) para evaluar mejor el rendimiento del método propuesto. En resumen, todos los resultados experimentales indican que el enfoque propuesto es estable y robusto para predecir PPIs y promete ser una herramienta útil para la investigación en proteómica.