Optimización eficiente de la medida F con SVM sensibles a los costes
Autores: Fan, Cheng; Yuan, Zhou; Jian, Gao; Shuangqiu, Zheng
Idioma: Inglés
Editor: Hindawi Publishing Corporation
Año: 2016
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Medida F&semi
mé
tricas de rendimiento&semi
clasificació
n&semi
clases desequilibradas&semi
optimizació
n&semi
SVM sensible a los costes&period
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La medida F es una de las métricas de rendimiento más utilizadas en clasificación, sobre todo cuando las clases están muy desequilibradas. La optimización directa de esta medida suele ser un reto, ya que no existe una solución de forma cerrada. Los algoritmos actuales diseñan los clasificadores utilizando las aproximaciones a la medida F. Estos algoritmos no son eficientes y no se adaptan bien a los grandes conjuntos de datos. Para llenar este vacío, en este artículo proponemos un nuevo algoritmo que puede optimizar eficientemente la medida F con SVM sensibles a los costes. En primer lugar, presentamos una transformación explícita de la optimización de la medida F a la SVM sensible a costes. A continuación, adoptamos el método bundle para resolver la optimización interna. Para el problema en el que el método bundle existente puede tener fluctuaciones en el objetivo primal durante las iteraciones, se utiliza un procedimiento de búsqueda de línea adicional, que puede aliviar el problema de las fluctuaciones y hacer que nuestro algoritmo sea más eficiente. Los estudios empíricos sobre conjuntos de datos a gran escala demuestran que nuestro algoritmo puede proporcionar una aceleración significativa con respecto a los aprendices basados en la medida F de última generación, al tiempo que obtiene soluciones precisas mejores (o comparables).
Descripción
La medida F es una de las métricas de rendimiento más utilizadas en clasificación, sobre todo cuando las clases están muy desequilibradas. La optimización directa de esta medida suele ser un reto, ya que no existe una solución de forma cerrada. Los algoritmos actuales diseñan los clasificadores utilizando las aproximaciones a la medida F. Estos algoritmos no son eficientes y no se adaptan bien a los grandes conjuntos de datos. Para llenar este vacío, en este artículo proponemos un nuevo algoritmo que puede optimizar eficientemente la medida F con SVM sensibles a los costes. En primer lugar, presentamos una transformación explícita de la optimización de la medida F a la SVM sensible a costes. A continuación, adoptamos el método bundle para resolver la optimización interna. Para el problema en el que el método bundle existente puede tener fluctuaciones en el objetivo primal durante las iteraciones, se utiliza un procedimiento de búsqueda de línea adicional, que puede aliviar el problema de las fluctuaciones y hacer que nuestro algoritmo sea más eficiente. Los estudios empíricos sobre conjuntos de datos a gran escala demuestran que nuestro algoritmo puede proporcionar una aceleración significativa con respecto a los aprendices basados en la medida F de última generación, al tiempo que obtiene soluciones precisas mejores (o comparables).