Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2021-02-18Un traductor online basado en 5G, una posibilidad real

Blogthinkbig |Las aplicaciones de un traductor online cada vez son mayores. Y lo son por una sencilla razón. La tecnología ha mejorado mucho en los últimos años, con lo que se vuelve útil en más y más contextos. A este tipo de apps, además, se les abre un prometedor camino gracias al 5G. La nueva conectividad permitirá eliminar la latencia, con lo que el procesamiento en la nube será más fluido. Un adiós a las interrupciones.

De los sistemas en móviles pre-Internet al traductor online

La introducción de la tecnología en la traducción simultánea tiene su primer hito en los Juicios de Núremberg. Con algunos precedentes aislados antes, al término de la Segunda Guerra Mundial se creó una necesidad insoslayable. Había que organizar el juicio más grande de la historia por crímenes de guerra y contra la Humanidad. Y había que hacerlo en cuatro idiomas: inglés, alemán, francés y ruso. El 20 de octubre de 1945 dieron comienzo las sesiones con un sistema desarrollado por IBM, que incluía micrófonos y auriculares. A través de estos, los intérpretes podían enviar su voz a los presentes.

Pero cuando las máquinas empiezan a hacer esta labor de traducción por sí mismas fue a finales de los años 90 y principios de los 2000. Los primeros sistemas surgen en Japón, de la mano del centro de investigación en telecomunicaciones ATR y también de la compañía NEC. Esta última creó un sistema que se instalaba en los teléfonos móviles de la época. Evidentemente estaban lejos de ser smartphones. Pero el software podía reconocer 50.000 palabras en japonés y 30.000 palabras en inglés.

Poco después comenzaron a implantarse sistemas de traducción en Internet, aún lejos de integrarse en los móviles. El famoso traductor online de Google nació en 2006 como un servicio de traducción automática basado en estadística. Su algoritmo se nutrió al principio de documentos de la ONU y del Parlamento Europeo, traducidos a múltiples lenguas.

El traductor de Google sirvió de modelo para otras iniciativas similares destinadas también al mercado de consumo. El uso de algoritmos predictivos para buscar patrones evolucionó a lo largo del tiempo. Y ahora la mayoría de sistemas de traducción simultánea emplean machine learning y deep learning. Son dos ramas de la inteligencia artificial que permiten a estos sistemas aprender y perfeccionarse.

Procesamiento del lenguaje natural y reconocimiento de voz

Hay dos tecnologías clave en un traductor online. Se trata del procesamiento del lenguaje natural y del reconocimiento de voz. La primera consiste en convertir el lenguaje humano, hablado o escrito, en un código que los ordenadores puedan procesar. Y vice versa, claro. Algunos de los retos con los que se topa esta tecnología están en la ambigüedades fónicas o morfológicas de palabras y expresiones en las diferentes lenguas. El procesamiento del lenguaje natural es un componente básico, aunque el éxito de los resultados de traducción también depende de su representación. Aquí influyen la capacidad que tenga el traductor para realizar una entonación adecuada o hacer las pausas.

Ligado a esta tecnología está el reconocimiento de voz. Cualquier traductor hoy en día es capaz de reconocer una frase perfectamente pronunciada, con una dicción impecable en un idioma común, como el inglés o el español. Pero estos sistemas tienen que ser capaces de reconocer todo tipo de acentos, así como las expresiones propias de cada cultura y cada lengua. No es lo mismo el inglés de Texas que el de Escocia, ni habla igual una persona de Nueva Delhi o una de Durban. Tampoco es equiparable el acento de un burgalés con el de un gaditano o el de un habitante de Bogotá.

El reconocimiento de voz hace que sea posible traducir sin trabas una misma frase pronunciada con diferentes acentos. Las expresiones son un nivel más complicado aún. La captación de frases hechas y refranes solo se puede integrar en un traductor online mediante el aprendizaje automático exhaustivo y continuo. Tanto esta tecnología como el procesamiento del lenguaje natural se verán facilitadas por el 5G.

Aunque estas tecnologías tienen limitaciones según qué contextos. “Es verdad que se han producido avances significativos, pero todavía queda mucho camino por recorrer”, comenta Fernando Maldonado, analista principal en IDG. “Los avances que se producen en un contexto muy concreto tienden a extrapolarse a la totalidad de casos de uso. Esto crea una falsa sensación de lo que hoy se puede hacer y que no. Digo esto porque NPL (natural language processing), NPU (neural processing unit) y NLG (natural language generation) tienen todavía limitaciones para poder aplicarse en contextos donde el coste de error sea elevado, como por ejemplo asuntos médicos o legales”.

La explosión de la traducción en móviles

En los móviles, las NPU (neural processing unit) permiten un procesamiento de tareas de inteligencia artificial mucho más ágil. Distribuyen parte del procesamiento que hace el traductor online entre la nube y el smartphone. De esta forma se gana eficiencia. Este tipo de chips permiten incluso la aparición de traductores offline de cierta precisión, aunque no son comparables a los que se basan en la red.

Hasta ahora, los traductores se han empleado más para textos escritos. En la mayoría de las ocasiones se usan para copiar un texto de una web y pasarlo a nuestro idioma. Muchas apps ya poseen la funcionalidad de enfocar unas líneas —como la carta de un restaurante o un letrero— y traducirlas mediante realidad aumentada. Sin embargo, la traducción simultánea, o casi (pues hay que esperar a que la persona termine de hablar para ver el resultado), se cuela en las conversaciones habladas poco a poco.

En un viaje turístico —aunque sea difícil recordarlos en plena pandemia— ya no es extraño usar el móvil de mediador para hablar con alguien. El proceso es sencillo: uno habla en su idioma, el traductor online lo traduce a la otra lengua y reproduce el mensaje. La otra persona hace lo mismo pero al revés. Desde luego quedan flecos por pulir, sobre todo entre idiomas con una gramática y simbología muy distantes. Pero se avanza rápido. Y el 5G supondrá un empujón a este tipo de usos.

“Este año se han producido múltiples anuncios en el CES en torno a servicios de traducción desde el móvil. Aunque cada proveedor tiene su propio enfoque, todas se nutren de tecnologías del lenguaje. La importancia de que la traducción simultánea se esté llevando al móvil es que algunos casos de uso van a escalar rápidamente”, apunta Maldonado.

El 5G y la baja latencia

Una de las grandes ventajas que tiene el 5G para la traducción simultánea es su baja latencia. Es mucho menor en comparación con los valores del 4G, que muestra un retardo de unos 50 milisegundos en la señal. En cambio, la nueva generación de red solo se demora entre 1-5 milisegundos.

En un traductor online esto sirve para que una conversación entre dos personas, mediatizada por el móvil, tenga mayor fluidez. El audio que recoge el sistema se procesa y se envía a un servidor, que devuelve la respuesta mucho antes que con el 4G. Maldonado lo explica de la siguiente manera: “En concreto, el 5G permite centralizar el procesamiento en la nube sin que el usuario lo perciba. La ventaja de esta opción frente a otras, como los traductores offline, es que al producirse a escala y estar basadas en inteligencia artificial, su proceso de aprendizaje es muy rápido, lo que se traslada directamente al servicio”. Es decir, no solo gana fluidez el usuario cuando usa el traductor. A la larga, el aumento en el uso del servicio perfecciona los algoritmos y se ofrece un resultado más preciso.

Otra ventaja destacada tiene que ver con la accesibilidad a estas capacidades de traducción simultánea. Por el momento solo los móviles de última generación tienen capacidad de procesamiento local suficiente para soportar tareas de IA como las que ejecuta un traductor. Hay que recordar que las NPU solo están presentes aún en terminales de alta gama.

Pero gracias a la nueva conectividad, estos servicios estarán presentes en una gama más amplia de móviles. “El 5G puede introducir servicios de traducción en tiempo real en dispositivos que no tienen capacidad de procesamiento local suficiente. Para ello el procesamiento se lleva a la nube. En otras palabras, el 5G permite arquitecturas que hacen posible que la mayoría de los móviles puedan soportar servicios de traducción en tiempo real.

Una conversación entre dos personas mediante traductor


La espiral del silencio


Otro de los aliados de los traductores online, dentro del 5G, es el edge computing. Esta tecnología, asociada a la nueva generación de red, puede jugar un papel importante en el servicio. Con el objetivo de mejorarlo, Telefónica tiene un acuerdo con la compañía australiana Lingmo, especializada en software de traducción.

Ambas compañías se han asociado para optimizar los resultados de una traducción online. El audio que capta el móvil se envía a los servidores de edge computing que posee Telefónica, que integran software de traducción. De esta forma, la señal se procesa muy rápidamente, se genera la respuesta y se envía al destino.

La idea es que dos personas que hablen idiomas distintos puedan comunicarse de forma fluida solo con usar sus móviles. El proyecto se pone en marcha con un piloto en el Hotel Meliá Serrano, de Madrid. Desde luego, este tipo de iniciativas son herramientas llamadas a facilitar el turismo.

Blogthinkbig
Autor
Blogthinkbig

El blog de innovación de Telefónica

Empresas destacadas

Productos destacados