Por su carácter ofensivo o vulgar, las obscenidades son palabras o expresiones consideradas inapropiadas en conversaciones públicas. Hoy en día es común encontrar en blogs, foros y redes sociales el uso de obscenidades para insultar a o denigrar de opiniones, personajes o marcas; una anomalía cuyo agravante es mayor si se tiene en cuenta la amplia cobertura mundial que pueden alcanzar. El uso de diccionarios de palabras vetadas como mecanismo de filtrado es insuficiente, debido a la versatilidad del lenguaje escrito, que permite a los usuarios inventar variantes con transliteraciones o enmascaramientos del texto (por ejemplo, cambiar mierda por m1erd@ o m.i.e.r.d.a). Inspirados en la genómica comparativa, se ha desarrollado un foro web experimental (ForumForte), donde los mensajes ingresados por los usuarios son inspeccionados y depurados de obscenidades transliteradas o enmascaradas. Este artículo presenta dicho software con una descripción breve de su diseño y su uso con datos reales de comentarios provenientes de medios digitales en español y portugués. La efectividad se ubicó entre 84% y 97% en la escala de palabra, dependiendo de la longitud de la obscenidad (para más de cuatro letras), y en 86% en la escala de comentario. Estos resultados insinúan la utilidad del software para filtrado de obscenidades en foros web, independientes del idioma del usuario.
INTRODUCCIÓN
Una característica esencial de los medios digitales de la Web2.0 es su capacidad para generar contenidos de forma colectiva por parte de los usuarios, motivando la colaboración y la construcción mutua de escenarios para obtener experiencias más ricas para los usuarios [1]. Un ejemplo ilustrativo son los foros y blogs digitales, en los que múltiples usuarios generan comentarios escritos sobre sus propias opiniones o las de otros. Desgraciadamente, algunos usuarios abusan de esta libertad de expresión con fines inapropiados, como insultar, degradar o potenciar opiniones, participantes, marcas o cualquier otro concepto mediante un lenguaje ofensivo u obsceno. Por estas razones, normalmente este tipo de servicios digitales deben ser moderados por los administradores de los sitios web para garantizar que los contenidos de texto generados por los usuarios estén libres de blasfemias.
Los filtros basados en el léxico, que cotejan el texto con una lista negra de términos prohibidos, son una herramienta de moderación ingenua.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Clasificador de representación colaborativa mejorado basado en l2-Regularized para el reconocimiento de acciones humanas
Artículo:
Filtros de bucle de dos integradores: Generación mediante expansión NAM y revisión
Artículo:
Implementación de una coordinación de protección óptima para microrredes con generación distribuida mediante un esquema de protección cuaternaria
Artículo:
Mejora de la supresión de interferencias en el lóbulo principal mediante el preprocesamiento de la matriz de bloqueo
Artículo:
Programación multiusuario en el enlace descendente de un sistema celular LTE
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Importancia, manejo y control de extraíbles e incrustaciones (pitch) en la fabricación de papel
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores
Libro:
Planta de tratamiento de aguas residuales