Inferiendo Redes Regulatorias de Genes a partir de Datos de RNA-seq Usando Clasificación por Núcleo
Autores: Al-Aamri, Amira; Kudlicki, Andrzej S.; Maalouf, Maher; Taha, Kamal; Homouz, Dirar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Inferiendo Redes Regulatorias de Genes a partir de Datos de RNA-seq Usando Clasificación por NúcleoCategoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Perfilado de expresión génica
Redes regulatorias génicas
Secuenciación de ARN
Datos de microarreglos
Modelos de clasificación
Técnicas de normalización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
El perfilado de expresión génica es una de las técnicas más reconocidas para inferir reguladores génicos y sus posibles objetivos en las redes regulatorias génicas (GRN). El propósito de este estudio es construir una red regulatoria para el genoma de la levadura en brote incorporando el uso de datos de RNA-seq y microarrays representados por una amplia gama de condiciones experimentales. Introducimos un pipeline para el análisis de datos, la preparación de datos y el entrenamiento de modelos. Se utilizan varios modelos de clasificación por kernel; incluyendo métodos de clasificación de una clase, dos clases y eventos raros, para categorizar genes. Probamos el impacto de las técnicas de normalización en el rendimiento general de RNA-seq. Nuestros hallazgos proporcionan nuevas perspectivas sobre las interacciones entre genes en la red regulatoria de la levadura. Las conclusiones de nuestro estudio tienen una importancia significativa ya que destacan la efectividad de la clasificación y su contribución a mejorar la comprensión actual de la red regulatoria de la levadura. Al ser evaluado, nuestro pipeline demuestra un rendimiento sólido en diferentes métricas estadísticas, como una tasa de recuperación del 99% y un puntaje AUC del 98%.
Descripción
El perfilado de expresión génica es una de las técnicas más reconocidas para inferir reguladores génicos y sus posibles objetivos en las redes regulatorias génicas (GRN). El propósito de este estudio es construir una red regulatoria para el genoma de la levadura en brote incorporando el uso de datos de RNA-seq y microarrays representados por una amplia gama de condiciones experimentales. Introducimos un pipeline para el análisis de datos, la preparación de datos y el entrenamiento de modelos. Se utilizan varios modelos de clasificación por kernel; incluyendo métodos de clasificación de una clase, dos clases y eventos raros, para categorizar genes. Probamos el impacto de las técnicas de normalización en el rendimiento general de RNA-seq. Nuestros hallazgos proporcionan nuevas perspectivas sobre las interacciones entre genes en la red regulatoria de la levadura. Las conclusiones de nuestro estudio tienen una importancia significativa ya que destacan la efectividad de la clasificación y su contribución a mejorar la comprensión actual de la red regulatoria de la levadura. Al ser evaluado, nuestro pipeline demuestra un rendimiento sólido en diferentes métricas estadísticas, como una tasa de recuperación del 99% y un puntaje AUC del 98%.