Ficha técnica

260 | 3

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Detección de anomalías en grandes volúmenes de datosAnomalies detection for big data

Resumen

El desarrollo de la era digital ha traído como consecuencia un incremento considerable de los volúmenes de datos. A estos grandes volúmenes de datos se les ha denominado bigdataya que exceden la capacidad de procesamiento de sistemas de bases de datos convencionales. Diversos sectores consideran varias oportunidades y aplicaciones en la detección de anomalías en problemas de big data. Para realizar este tipo de análisis puede resultar muy útil el empleo de técnicas de minería de datos porque permiten extraer patrones y relaciones desde grandes cantidades de datos. El procesamiento y análisis de estos volúmenes de datos, necesitan de herramientas capaces de procesarlos como Apache Spark y Hadoop. Estas herramientas no cuentan con algoritmos específicos para la detección de anomalías. El objetivo del trabajo es presentarun nuevo algoritmo para la detección de anomalías basado en vecindad para deproblemas big data. A partir de un estudio comparativo se seleccionó el algoritmo KNNW por sus resultados, con el fin de diseñar una variante big data. La implementación del algoritmo big datase realizó en la herramienta Apache Spark, utilizando el paradigma de programación paralela MapReduce. Posteriormente se realizaron diferentes experimentos para analizar el comportamiento del algoritmo con distintas configuraciones. Dentro de los experimentos se compararon los tiempos de ejecución y calidad de los resultados entre la variante secuencial y la variante big data. La variante big dataobtuvo mejores resultados con diferencia significativa. Logrando que la variante big data, KNNW-Big Data, pueda procesar grandes volúmenes de datos.

I. INTRODUCCIÓN

Actualmente muchas compañías en sus sistemas de información registran todas las transacciones que se realizan. La gran cantidad de datos almacenada sobrepasa con creces las capacidades humanas para su procesamiento y análisis manual; limitando las capacidades de detección de fraude en la institución. Una de las soluciones planteadas para el apoyo a la detección de fraude ha sido la identificación de anomalías o datos atípicos para analizar aquellas transacciones de los clientes que no corresponden a lo que habitualmente este hace [1,2,3]. Para lograr este objetivo se hace necesario la utilización de herramientas informáticas, que permitan identificar dentro de miles o millones de transacciones y registros, patrones de comportamiento que son inusuales y corresponden a actividades potencialmente fraudulentas. En [1] se presenta un breve estudio de las diferentes técnicas que han sido aplicadas. Las técnicas utilizadas se enfocan fundamentalmente en la detección de anomalías [4, 5], las cuales pueden depender de factores como la naturaleza de los datos, la disponibilidad de los datos etiquetados y el tipo de anomalías que se desee detectar.

Autor:Torres-Domínguez, Omar; Sabater-Fernández, Samuel; Bravo-Ilisatigui, Lisandra; Martin-Rodríguez, Diana; García-Borroto, Milton.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería de sistemas
Año de publicación:2019.
Editor:Universidad Pedagógica y Tecnológica de Colombia - UPTC

Tipo de documento:Artículo
Formato:pdf
Idioma:Español
Tamaño:534 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Detección de anomalías en grandes volúmenes de datos

DC.Title.eng

Anomalies detection for big data

DC.Creator

Torres-Domínguez, Omar; Sabater-Fernández, Samuel; Bravo-Ilisatigui, Lisandra; Martin-Rodríguez, Diana; García-Borroto, Milton

DC.Subject.snpi.spa

Minería de datos Datos masivos Análisis de datos

DC.Subject.snpi.eng

Data mining Big data data analysis

DC.Subject.spa

Big data; detección de anomalías; MapReduce; minería de datos

DC.Subject.eng

Big data;data mining; detecting anomalies; MapReduce

DC.Description.spa

I. INTRODUCCIÓN

DC.Source

https://revistas.uptc.edu.co/index.php/ingenieria/article/view/8793/7288

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/deteccion-de-anomalias-en-grandes-volumenes-de-datos

DC.Identifier.issn-isbn

ISSN:2357-5328 (Versión electrónica); 0121-1129 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Enero 2019, Revista facultad de Ingeniería Vol. 28 No. 50

DC.Language

Español

DC.Relation

DC.Publisher

Universidad Pedagógica y Tecnológica de Colombia - UPTC

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2019

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

31686.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Biblioteca76.515 documentos en línea

Ficha técnica

Detección de anomalías en grandes volúmenes de datosAnomalies detection for big data

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Transporte neumático de sólidos

Tratamiento de residuos (químicos y biológicos)

Biorrefinería a partir de microalgas

Constructor de áreas

Técnicas de caracterización de polímeros

Fracciones: números mixtos

Explorador de igualdades: intro

Videos

Itinerario de camiones de transporte de materiales peligrosos - Audiencia pública MassDOT en Boston - 23 de agosto de 2011

Video Conferencias sobre Ingeniería Bioquímica: Conferencia # 26: Diseño de Bioreactores.

Módulo 05, lección 38. Sensor de presión: conceptos de diseño, procesamiento y empaque. Parte 2

Relacioón de la Ergonomía con la Salud Ocupacional

13. Mecánica estadística clásica. Parte 2

Diálogos Ambientales - Minería ilegal

Identificación y clasificación fundamentales de residuos sólidos (parte 1 de 2)

Documentos más descargados

2022-11-15
El incremento del precio de los alimentos y la necesidad de una economía sostenible

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca76.515 documentos en línea

Ficha técnica

Detección de anomalías en grandes volúmenes de datosAnomalies detection for big data

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Transporte neumático de sólidos

Tratamiento de residuos (químicos y biológicos)

Biorrefinería a partir de microalgas

Constructor de áreas

Técnicas de caracterización de polímeros

Fracciones: números mixtos

Explorador de igualdades: intro

Videos

Itinerario de camiones de transporte de materiales peligrosos - Audiencia pública MassDOT en Boston - 23 de agosto de 2011

Video Conferencias sobre Ingeniería Bioquímica: Conferencia # 26: Diseño de Bioreactores.

Módulo 05, lección 38. Sensor de presión: conceptos de diseño, procesamiento y empaque. Parte 2

Relacioón de la Ergonomía con la Salud Ocupacional

13. Mecánica estadística clásica. Parte 2

Diálogos Ambientales - Minería ilegal

Identificación y clasificación fundamentales de residuos sólidos (parte 1 de 2)

Documentos más descargados

2022-11-15El incremento del precio de los alimentos y la necesidad de una economía sostenible

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-11-15
El incremento del precio de los alimentos y la necesidad de una economía sostenible