El Descubrimiento de Conocimiento en Bases de Datos (KDD) es un proceso compuesto por varias etapas, que comienza con la recolección de datos para el problema en cuestión y termina con la interpretación y evaluación de los resultados obtenidos. El presente trabajo pretende mostrar la influencia del análisis exploratorio de datos en el rendimiento de las técnicas de Minería de Datos en cuanto a la clasificación de nuevos patrones a través de su aplicación a un problema médico, además de comparar su rendimiento entre sí, con el objetivo de obtener la técnica con mayor porcentaje de aciertos. A partir de los resultados obtenidos, se puede concluir que este análisis, si se realiza adecuadamente, puede aportar importantes mejoras en el rendimiento de casi todas las técnicas abordadas, convirtiéndose así en una importante herramienta para optimizar los resultados finales. Para el problema en estudio, la técnica que involucra un modelo de Programación Lineal y otra que involucra Redes Neuronales fueron las técnicas que presentaron el menor porcentaje de errores para los conjuntos de prueba, presentando capacidades de generalización satisfactorias.
1. INTRODUCCIÓN
Abordar las técnicas y herramientas que buscan transformar los datos almacenados, ya sean de industrias, bancos, hospitales, telecomunicaciones, ecológicos, inmobiliarios y otros, en conocimiento es el objetivo del área denominada Descubrimiento de Conocimiento en Bases de Datos (KDD).
El proceso de KDD es un conjunto de actividades continuas que comparten el conocimiento descubierto a partir de bases de datos. Según Fayyad et al. (1996), este conjunto se compone de cinco pasos: selección de datos; preprocesamiento y limpieza de datos; transformación de datos; minería de datos; e interpretación y evaluación de los resultados. La interacción entre estas distintas etapas puede verse en la Figura 1, donde las tres primeras pueden interpretarse como el análisis exploratorio de datos.
El proceso KDD se refiere a cualquier proceso de descubrimiento de conocimiento útil en los datos, mientras que la Minería de Datos se refiere a la aplicación de algoritmos para extraer modelos de los datos; hasta 1995, muchos autores consideraban los términos KDD y Minería de Datos como sinónimos. Según Freitas (2000), el conocimiento a descubrir debe cumplir tres propiedades: debe ser correcto (en la medida de lo posible); debe ser comprensible por los usuarios humanos; y debe ser interesante/útil/nuevo. Asimismo, el método de descubrimiento de conocimientos debe presentar las tres características siguientes: debe ser eficaz (preciso), genérico (aplicable a varios tipos de datos) y flexible (fácilmente modificable).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Investigación literaria: postulaciones políticas en la novela colombiana del siglo XX
Artículo:
Mapeo de un núcleo inicial de referencias en Minería de Datos a partir de revistas publicadas en Brasil
Artículo:
Análisis de procesos teóricos de sistemas (STPA): un análisis bibliométrico y de patentes
Artículo:
Atención a la discapacidad intelectual en la escuela primaria: formación docente en el servicio
Artículo:
Entorno asincrónico-colaborativo de e-training para la enseñanza de las turbomáquinas
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Infografía:
Sistemas de calidad. Six Sigma
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.