Ficha técnica

377 | 3

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Using hybrid associative classifier with translation (HACT) for studying imbalanced data setsEstudio de conjuntos de datos desbalanceados usando un modelo asociativo con traslación de ejes

Resumen

En diversos problemas de reconocimiento de patrones, se ha observado que el desequilibrio de clases puede disminuir el desempeño del clasificador, principalmente en los patrones de las clases minoritarias. Una estrategia para resolver el problema del desbalance, consiste en tratar por separado las clases incluidas en el problema (clase minoritaria o mayoritaria), a fin de equilibrar los conjuntos de datos. En este sentido, la motivación del presente artículo estriba en el hecho de que el modelo asociativo visto como Clasificador Híbrido Asociativo con Traslación (CHAT), es muy sensible al des-balance de las clases. Por ello, se analiza el impacto que los conjuntos de datos des-balanceados pueden tener sobre el rendimiento del CHAT. Adicionalmente, se analiza la conveniencia de utilizar métodos de bajo-muestreo para disminuir los efectos negativos que el modelo asociativo pueda sufrir. La viabilidad de este estudio se sustenta con los resultados experimentales obtenidos de once conjuntos de datos reales. Finalmente, el presente trabajo se considera como una investigación analítica-sintética.

Introducción

Karl Steinbuch introdujo el primer modelo asociativo, llamado Lernmatrix, en 1961 (Santiago, 2003); puede utilizarse como clasificador de patrones binarios. Desde entonces se han desarrollado varios modelos asociativos, como los modelos HACT, morfológico y alfa beta (Santiago, 2003).

El rendimiento del clasificador está muy relacionado con dos aspectos en el reconocimiento de patrones, independientemente de la aplicación (Japkowicz, 2002; Huang et al., 2006): el modelo de aprendizaje utilizado por el clasificador y la calidad del conjunto de datos (DS) utilizado para el entrenamiento. Algunos problemas inherentes al DS son el desequilibrio del DS, los patrones redundantes, la atipicidad y la alta dimensión (Barandela et al., 2005). Este artículo se centra en el problema del desequilibrio.

El desequilibrio se produce cuando una clase (minoritaria) está muy poco representada en comparación con otras clases (mayoritarias) (Weiss, 2004). Los casos reales (categorización de textos, análisis de créditos) suelen tener pocas muestras de clases minoritarias (Tan, 2005; Huang et al., 2006). La escasa representación de las clases minoritarias complica el aprendizaje del clasificador (Weiss, 2004) y actualmente no existe una solución universal para abordar este problema. Las estrategias de solución propuestas han incluido el muestreo (sobremuestreo o submuestreo) o el ajuste del algoritmo de entrenamiento (Barandela et al., 2005; Chawla et al., 2002).

En este estudio se analiza el rendimiento de un modelo asociativo (HACT) en desequilibrio en relación con dos aspectos: cómo se ve afectado el entrenamiento del modelo cuando se utiliza un DS desequilibrado y la conveniencia de utilizar un muestreo bajo de DS.

Autor:Camacho Nieto, Oscar; Cleofas Sánchez, Laura; Guzmán Escobedo, Magali; Valdovinos Rosas, Rosa María; Yáñez Márquez, Cornelio.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería electrónica y afines
Año de publicación:2012.
Editor:Universidad Nacional de Colombia

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño:413 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Using hybrid associative classifier with translation (HACT) for studying imbalanced data sets

DC.Title.eng

Estudio de conjuntos de datos desbalanceados usando un modelo asociativo con traslación de ejes

DC.Creator

Camacho Nieto, Oscar; Cleofas Sánchez, Laura; Guzmán Escobedo, Magali; Valdovinos Rosas, Rosa María; Yáñez Márquez, Cornelio

DC.Subject.snpi.spa

Toma de decisiones - Modelos matemáticos Ingeniería de software Algoritmos (Computadores)

DC.Subject.snpi.eng

Decision-making - Mathematical models Software engineering Computer algorithms

DC.Subject.spa

Modelo asociativo; Bajo-muestreo; Clase des-balanceada; Pre-procesamiento

DC.Subject.eng

Data set; Associative model; Under sampling; Class imbalance; Pre-processing

DC.Description.spa

Introducción

DC.Source

https://revistas.unal.edu.co/index.php/ingeinv/article/view/28522/28824

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/estudio-de-conjuntos-de-datos-desbalanceados-usando-un-modelo-asociativo-con-traslacion-de-ejes

DC.Identifier.issn-isbn

ISSN:2248-8723 (Versión electrónica); 0120-5609 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Abril 2012, Ing. Investig. Vol 32. No 1

DC.Language

Inglés

DC.Relation

DC.Publisher

Universidad Nacional de Colombia

DC.Contributor

DC.Rights

Derechos de autor:1

DC.Date

2012

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

21847.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Información del documento

Titulo:Using hybrid associative classifier with translation (HACT) for studying imbalanced data sets
Autor:Camacho Nieto, Oscar; Cleofas Sánchez, Laura; Guzmán Escobedo, Magali; Valdovinos Rosas, Rosa María; Yáñez Márquez, Cornelio
Tipo:Artículo
Año:2012
Idioma:Inglés
Editor:Universidad Nacional de Colombia
Materias:Toma de decisiones - Modelos matemáticos Ingeniería de software Algoritmos (Computadores)
Descarga:3

Biblioteca93.141 documentos en línea

Ficha técnica

Using hybrid associative classifier with translation (HACT) for studying imbalanced data setsEstudio de conjuntos de datos desbalanceados usando un modelo asociativo con traslación de ejes

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Generalidades de Condensadores - Intro

Centrifugación

La historia del chocolate

Obtención de la carne

IA Aplicaciones industriales

Construye una fracción

Parejas de fracciones

Videos

Seminario web: Impulsar la creación de empleo rural y el crecimiento económico

Parques de ecoinnovación: eficiencia en el uso de recursos, simbiosis industrial y ecoinnovación

La innovación de los procesos de negocio para conseguir la transformación digital de su organización

Ejemplos del método directo de elementos de frontera. Lección 6

Aditec - Webinar PTAR: Degradación de Contaminantes Orgánicos

Valorización energética de residuos en fábricas de cemento

Introducción de la investigación en nanotecnología y electrospinning de nanofibras compuestas de polímero a estudiantes de secundaria

Documentos más descargados

2022-11-04
Conservación de alimentos por medio de alta presión

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca93.141 documentos en línea

Ficha técnica

Using hybrid associative classifier with translation (HACT) for studying imbalanced data setsEstudio de conjuntos de datos desbalanceados usando un modelo asociativo con traslación de ejes

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Generalidades de Condensadores - Intro

Centrifugación

La historia del chocolate

Obtención de la carne

IA Aplicaciones industriales

Construye una fracción

Parejas de fracciones

Videos

Seminario web: Impulsar la creación de empleo rural y el crecimiento económico

Parques de ecoinnovación: eficiencia en el uso de recursos, simbiosis industrial y ecoinnovación

La innovación de los procesos de negocio para conseguir la transformación digital de su organización

Ejemplos del método directo de elementos de frontera. Lección 6

Aditec - Webinar PTAR: Degradación de Contaminantes Orgánicos

Valorización energética de residuos en fábricas de cemento

Introducción de la investigación en nanotecnología y electrospinning de nanofibras compuestas de polímero a estudiantes de secundaria

Documentos más descargados

2022-11-04Conservación de alimentos por medio de alta presión

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-11-04
Conservación de alimentos por medio de alta presión