Ficha técnica

154 | 3

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Improving the performance of anti-spam filters using out-of-vocabulary statisticsMejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

Resumen

Este artículo presenta una característica basada en estadísticas de palabras desconocidas (fuera del vocabulario) quecomplementa las fuentes de información usadas en la decisión por parte de los filtros anti-spam actuales. Los experimentosincluyeron filtros anti-spam disponibles libremente como referencia: SpamAssassin, Bogofilter, SpamBayes y SpamProbe,así como también un clasificador puramente bayesiano. Los resultados muestran que la decisión basada en la característicapropuesta mejora el rendimiento de todos los filtros anti-spam sujetos a estudio.

INTRODUCCIÓN

El correo electrónico comercial no solicitado, comúnmente conocido como spam, sigue siendo un problema importante para los usuarios de Internet. Los principales efectos molestos del spam son la disminución de la productividad de los empleados, el desperdicio de un valioso espacio de almacenamiento en los servidores de correo, el perjuicio para el tráfico de Internet y el aumento de la posible pérdida de información en función de las políticas de filtrado. Por ejemplo, los autores de este trabajo estuvieron a punto de perder un correo electrónico de aceptación de trabajos debido a los filtros de spam.

Según varias fuentes de información, como Softscan [1] o Marshal [2], más del 90% del tráfico de correo electrónico es spam, con un índice de volumen creciente durante los últimos años. Los mayores porcentajes proceden de Europa y Asia (65% según las estadísticas de Marshal), seguidos de Norteamérica (18%).

Los spammers utilizan la estrategia de enviar una gran cantidad de correos electrónicos prácticamente sin coste, con un alto beneficio probable. Si un spammer obtiene tan sólo 100 respuestas por cada 1.000.000 de mensajes de correo electrónico, puede obtener un atractivo beneficio. Para más detalles, puede leer "Inside the SPAM Cartel: Trade Secrets From the Dark Side" [3].

En la literatura encontramos dos tendencias principales sobre técnicas de filtrado de spam: enfoques basados en reglas y en el aprendizaje [4-10].

Los filtros de spam basados en reglas analizan tanto la cabecera como el cuerpo de los mensajes de correo electrónico en busca de contenido sospechoso. Cada regla activada suma una puntuación al correo electrónico. Si la puntuación alcanza un valor umbral, el correo electrónico se clasifica como spam.

Las reglas abarcan diferentes amenazas, como el formato sospechoso (las partes de HTML y de texto son diferentes o el cuerpo del mensaje tiene entre un 80 y un 90% de líneas en blanco), un origen débil propenso a enviar spam (el remitente es un relé abierto confirmado o el remitente es un proxy abierto), palabras comunes en el spam (contiene una versión enmascarada de cialis o viagra), codificaciones o caracteres ilegales (demasiados caracteres ilegales en bruto en el asunto), etc [11].

Autor:Tulli, Juan Carlos Bonadero, Juan Carlos Liberatori, Monica Castiñeira Moreira, Jorge Agüero, Pablo Daniel.
Categoría:Ciencias naturales y subdisciplinas
Subcategoría:Matemáticas
Año de publicación:2009.
Editor:Universidad de Tarapacá

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño:146 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Improving the performance of anti-spam filters using out-of-vocabulary statistics

DC.Title.eng

Mejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

DC.Creator

Tulli, Juan Carlos Bonadero, Juan Carlos Liberatori, Monica Castiñeira Moreira, Jorge Agüero, Pablo Daniel

DC.Subject.snpi.spa

Gestión de información Estadística Vocabularios

DC.Subject.snpi.eng

Information management Statistics Vocabularies

DC.Subject.spa

Spam, filtrado, palabras desconocidas.

DC.Subject.eng

Spam, filtering, out-of-vocabulary.

DC.Description.spa

INTRODUCCIÓN

En la literatura encontramos dos tendencias principales sobre técnicas de filtrado de spam: enfoques basados en reglas y en el aprendizaje [4-10].

DC.Source

https://www.ingeniare.cl/index.php?option=com_ingeniare&view=d&doc=66/art12.pdf&aid=168&vid=66&lang=es

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/mejora-del-desempe-o-de-filtros-anti-spam-usando-estad-sticas-de-palabras-fuera-de-vocabulario

DC.Identifier.issn-isbn

ISSN:0718-3305 (Versión electrónica); 0718-3291 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Diciembre 2009, Ingeniare. Revista chilena de ingeniería Vol. 17 Núm. 3

DC.Language

Inglés

DC.Relation

DC.Publisher

Universidad de Tarapacá

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2009

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

47695.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Biblioteca76.515 documentos en línea

Ficha técnica

Improving the performance of anti-spam filters using out-of-vocabulary statisticsMejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Transporte neumático de sólidos

Tratamiento de residuos (químicos y biológicos)

Biorrefinería a partir de microalgas

Constructor de áreas

Técnicas de caracterización de polímeros

Fracciones: números mixtos

Explorador de igualdades: intro

Videos

Itinerario de camiones de transporte de materiales peligrosos - Audiencia pública MassDOT en Boston - 23 de agosto de 2011

Video Conferencias sobre Ingeniería Bioquímica: Conferencia # 26: Diseño de Bioreactores.

Módulo 05, lección 38. Sensor de presión: conceptos de diseño, procesamiento y empaque. Parte 2

Relacioón de la Ergonomía con la Salud Ocupacional

13. Mecánica estadística clásica. Parte 2

Diálogos Ambientales - Minería ilegal

Identificación y clasificación fundamentales de residuos sólidos (parte 1 de 2)

Documentos más descargados

2022-11-04
Conservación de alimentos por medio de alta presión

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca76.515 documentos en línea

Ficha técnica

Improving the performance of anti-spam filters using out-of-vocabulary statisticsMejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Transporte neumático de sólidos

Tratamiento de residuos (químicos y biológicos)

Biorrefinería a partir de microalgas

Constructor de áreas

Técnicas de caracterización de polímeros

Fracciones: números mixtos

Explorador de igualdades: intro

Videos

Itinerario de camiones de transporte de materiales peligrosos - Audiencia pública MassDOT en Boston - 23 de agosto de 2011

Video Conferencias sobre Ingeniería Bioquímica: Conferencia # 26: Diseño de Bioreactores.

Módulo 05, lección 38. Sensor de presión: conceptos de diseño, procesamiento y empaque. Parte 2

Relacioón de la Ergonomía con la Salud Ocupacional

13. Mecánica estadística clásica. Parte 2

Diálogos Ambientales - Minería ilegal

Identificación y clasificación fundamentales de residuos sólidos (parte 1 de 2)

Documentos más descargados

2022-11-04Conservación de alimentos por medio de alta presión

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-11-04
Conservación de alimentos por medio de alta presión