Biblioteca93.141 documentos en línea

Artículo

Plant MicroRNA Prediction by Supervised Machine Learning Using C5.0 Decision TreesPredicción de microARN en plantas mediante aprendizaje automático supervisado utilizando árboles de decisión C5.0

Resumen

Los microARN (miARN) son ARN no codificantes de proteínas de entre 20 y 22 nucleótidos de longitud que atenúan la producción de proteínas. Se están investigando distintos tipos de datos de secuencias en busca de nuevos miARN, incluidas secuencias genómicas y transcriptómicas. Diversos métodos de aprendizaje automático han logrado predecir precursores de miARN, miARN maduros y otras secuencias no codificantes de proteínas. MirTools, mirDeep2 y miRanalyzer requieren que se incluya el "recuento de lecturas" con las secuencias de entrada, lo que restringe su uso a datos de secuenciación profunda. Nuestro objetivo era entrenar un predictor utilizando una muestra representativa de diferentes especies para predecir con precisión miRNAs fuera del conjunto de entrenamiento. Queríamos un sistema que no requiriera el recuento de lecturas para la predicción y que, por tanto, pudiera aplicarse a secuencias cortas extraídas de fuentes genómicas, EST o RNA-seq. Se ha desarrollado un modelo de árbol de decisión para la predicción de miARN mediante aprendizaje automático supervisado. Sólo requiere que el genoma o transcriptoma correspondiente esté disponible dentro de una ventana de secuencia que incluya el precursor candidato, de modo que puedan recogerse las características de secuencia necesarias. Algunas de las características más críticas para el entrenamiento del predictor son la energía del dúplex miRNA:miRNA∗ y el número de desajustes en el dúplex. Presentamos un predictor de miARN de plantas de varias especies con una sensibilidad del 84,08% y una especificidad del 98,53%, basado en pruebas rigurosas de validación sin exclusión.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento