MultiSec: El aprendizaje profundo multi-tarea mejora el descubrimiento de proteínas secretadas en fluidos corporales humanos
Autores: He, Kai; Wang, Yan; Xie, Xuping; Shao, Dan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Predicción
Proteínas secretadas
Fluidos corporales humanos
Biomarcadores de enfermedades
MultiSec
Aprendizaje multitarea
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La predicción de proteínas secretadas en los fluidos corporales humanos es esencial ya que las proteínas secretadas prometen ser biomarcadores de enfermedades. Diversos enfoques han sido propuestos para predecir si una proteína es secretada en un fluido específico por su secuencia. Sin embargo, puede haber relaciones entre diferentes fluidos corporales cuando las proteínas son secretadas en estos fluidos. Los enfoques actuales ignoran directamente estas relaciones, por lo que su rendimiento es limitado. Aquí presentamos MultiSec, un enfoque mejorado para el descubrimiento de proteínas secretadas que explota las relaciones entre los fluidos a través del aprendizaje multitarea. Específicamente, se propone una estrategia de equilibrio basada en muestreo para resolver problemas de desequilibrio en todos los fluidos, se presenta una red efectiva para extraer características de todos los fluidos y se emplea un descenso de gradiente multiobjetivo para evitar que los fluidos se perjudiquen mutuamente. MultiSec fue entrenado y probado en 17 fluidos corporales humanos. Las comparaciones en los conjuntos de datos de prueba independientes demuestran que nuestro enfoque supera a otros en todos los fluidos comparados.
Descripción
La predicción de proteínas secretadas en los fluidos corporales humanos es esencial ya que las proteínas secretadas prometen ser biomarcadores de enfermedades. Diversos enfoques han sido propuestos para predecir si una proteína es secretada en un fluido específico por su secuencia. Sin embargo, puede haber relaciones entre diferentes fluidos corporales cuando las proteínas son secretadas en estos fluidos. Los enfoques actuales ignoran directamente estas relaciones, por lo que su rendimiento es limitado. Aquí presentamos MultiSec, un enfoque mejorado para el descubrimiento de proteínas secretadas que explota las relaciones entre los fluidos a través del aprendizaje multitarea. Específicamente, se propone una estrategia de equilibrio basada en muestreo para resolver problemas de desequilibrio en todos los fluidos, se presenta una red efectiva para extraer características de todos los fluidos y se emplea un descenso de gradiente multiobjetivo para evitar que los fluidos se perjudiquen mutuamente. MultiSec fue entrenado y probado en 17 fluidos corporales humanos. Las comparaciones en los conjuntos de datos de prueba independientes demuestran que nuestro enfoque supera a otros en todos los fluidos comparados.