Biblioteca93.141 documentos en línea

Artículo

Printed Persian Subword Recognition Using Wavelet Packet DescriptorsReconocimiento de subpalabras en persa impreso mediante descriptores de paquetes wavelet

Resumen

En este artículo presentamos un nuevo enfoque para el reconocimiento óptico de caracteres (OCR) sin conexión de subpalabras persas impresas mediante la transformada de paquetes wavelet. El algoritmo propuesto se utiliza para extraer características invariantes de la fuente y del tamaño a partir de 87804 subpalabras de 4 fuentes y 3 tamaños. Los vectores de características se comprimen mediante PCA. Los vectores de características obtenidos dan lugar a un diccionario pictórico para el que una entrada es la media de cada grupo que consta de la misma subpalabra con 4 fuentes en 3 tamaños. Los conjuntos de estas características se agrupan combinándolos con las características de punto para el reconocimiento de subpalabras persas impresas. Para evaluar los resultados de la extracción de características, este algoritmo se probó con un conjunto de 2.000 subpalabras en documentos de texto persa impresos. Se obtuvo una tasa de reconocimiento alentadora del 97,9% a nivel de subpalabra.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento