Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2021-07-22Privacidad en el diseño: cómo construir algoritmos que no nos manipulen con Machine Learning

Blogthinkbig |El Machine Learning es un concepto cada vez más familiar para el público y los usuarios de servicios digitales. Gracias a esta disciplina de la inteligencia artificial y las ciencias de la computación, los ordenadores pueden, entre otras cosas, identificar patrones que describen el comportamiento humano. Para que esto ocurra, las computadoras tienen que ser entrenadas con grandes cantidades de datos que se extraen directamente de la actividad de los usuarios y de la información que esta le confiere a la máquina.

Hasta aquí, suena todo bien. El problema llega cuando nos damos cuenta de que, al predecir comportamientos, el ordenador también puede detectar debilidades. O, dicho de otra manera, si el modelo aprende cuándo vas a comer helado o chocolate, también puede entender qué es lo que prefieres. Esto puede llevar a que el dueño del modelo de Machine Learning pueda manipular a los usuarios en beneficio propio. Llegados a este punto, la comunidad científica ha empezado a preguntarse: ¿cómo podemos preservar o, incluso, mejorar la privacidad de los usuarios y de sus datos, permitiendo a la vez que se puedan construir modelos de aprendizaje automático que den utilidad a esos datos?

Privacidad diferencial: poner la privacidad en el centro para evitar la manipulación derivada del Machine Learning

¿Cómo nos manipula el aprendizaje automático de las máquinas? Tomemos como ejemplo cualquiera de los escenarios donde podríamos estar interactuando con inteligencias artificiales entrenadas con Machine Learning: la web de una tienda de libros, nuestra app de vídeos favorita, etc. El aprendizaje automático facilita en estos casos el modelado y la predicción de clics en determinados artículos, ofreciendo recomendaciones de qué ver o qué comprar, basándose en tus preferencias. En estos casos, las opciones disponibles serían tantas que ningún usuario podría procesarlas todas. Por lo tanto, los usuarios terminan siendo animados, o incluso condicionados, a elegir de entre las recomendaciones que el método de Machine Learning preselecciona, basándose en las predicciones de aquello que el usuario va a preferir (o de lo que al dueño del método le interesa que prefiera).

Por esta razón, dentro de la comunidad de Machine Learning, se está trabajando en alternativas que solucionen esta problemática. El desarrollo de la tecnología conocida como “Pirvacy-Preserving Machine Learning” (algo así como aprendizaje automático que preserva la privacidad, cuyas siglas son PPML) está permitiendo avanzar y entender la compensación entre la privacidad de los datos y la utilidad de los modelos de aprendizaje.

Una de las técnicas que el PPML utiliza para proteger los datos de los usuarios es la privacidad diferencial. “Podemos imaginarnos la privacidad diferencial como un mecanismo que introduce ruido en los datos (o en el modelo de aprendizaje) para diferenciarlos de los datos originales. De esta manera, podemos “esconder” o diluir información que diferenciaría al usuario de los datos originales”, nos explica Nicolas Kourtellis, investigador en el equipo científico de Telefónica. 

Machine Learning: aprendizaje federado que preserva la privacidad

En sus últimas investigaciones, el equipo de Telefónica Research observó que la privacidad diferencial puede lograr una buena compensación entre la privacidad de los datos y la utilidad del modelo de Machine Learning, incluso en el caso de que un adversario tratase de interferir o atacar el modelo entrenado con ruido a través de la privacidad diferencial.

Otra línea de investigación que busca otra alternativa de PPML pasa por el Federated Learning (FL), o aprendizaje federado. El FL consiste en mantener los datos del usuario siempre en el borde de la red o en la fuente. Es decir, en lugar de recopilar los datos en el servidor, el dispositivo de cada usuario entrena su propia versión del modelo de Machine Learning localmente. Todos los modelos resultantes se recopilan y se agregan a un modelo único más poderoso. Pero como el modelo de aprendizaje que se genera en los dispositivos no es muy confiable, tienen que hacerse lo que se conocen como “rondas de aprendizaje federado”, en las que los datos vuelven a viajar a los dispositivos desde ese modelo único al que se han agregado y se vuelve a repetir el proceso, asegurando la alta fidelidad y utilidad del modelo.

Lo que pasa con el aprendizaje federado es que no siempre asegura la privacidad del usuario, porque la construcción de los parámetros del modelo puede filtrar información sensible. Para enfrentar este problema, y proteger los datos del usuario durante el aprendizaje del modelo, el equipo de Research ha propuesto recientemente el primer marco ‘Privacy-Preserving Federated Learning’ (PPFL). Este marco puede mejorar significativamente la privacidad y la utilidad del modelo, al mismo tiempo que reduce las repeticiones del proceso de aprendizaje del FL.

Los servicios que vendrán del aprendizaje federado

Aún existen multitud de desafíos a los que el Machine Learning tendrá que enfrentarse para seguir mejorando. El aprendizaje federado parece ser una solución prometedora, que sin embargo aún alberga muchas inestabilidades y problemáticas con respecto a la manera en que protege la privacidad de los usuarios.

Uno de los grandes potenciales que ofrece del aprendizaje federado es lo conocido como FLaaS (Federated Learning as a Service), que permite al operador construir modelos de FL en los dispositivos de los usuarios, y ofrecerlos como un servicio a terceras partes, permitiendo que estas colaboren en construir un modelo más rico.

Hay muchas cosas más que contar sobre aprendizaje federado y las infinitas posibilidades que este ofrece como servicio. Estad atentos porque pronto hablaremos extensamente de ello para que no os perdáis nada sobre las últimas novedades en este nuevo campo de la tecnología. Mientras tanto, en Telefónica seguiremos trabajando por construir unos servicios digitales seguros a la vez que conseguimos sacarle el máximo provecho a una tecnología tan útil y necesaria en nuestras vidas como ya lo es el Machine Learning.

Si quieres saber más sobre el Federated Learning y otras formas de PPML, haz click aquí para consultar las publicaciones que nuestro equipo de Research ha llevado a cabo sobre ello.

Blogthinkbig
Autor
Blogthinkbig

El blog de innovación de Telefónica


2021-09-16
¿Cómo elegir una buena formación online?

La formación online nos abre una puerta a reinventarnos sin importar en qué momento estemos de nuestra carrera profesional. Un ascenso, un cambio de empleo o, directamente, cambiar el rumbo de tu vida laboral. La educación digital, representada en cursos online que puedes hacer en cualquier momento, nos permite esto y más en un entorno profesional cada vez más competitivo y cambiante. Por suerte, estar a la altura de estos cambios está más cerca que nunca.

2021-09-16
SpaceX hace historia: envía a órbita con éxito la primera misión tripulada totalmente civil

Conseguido. SpaceX ha lanzado sin ningún aparente problema la misión Inspiration4 al espacio. Se trata de una misión particularmente especial como vimos hace unos días, al ser la primera que está compuesta sólo por civiles y sin ningún astronauta profesional.

2021-09-16
Bachelet pide una moratoria urgente en la venta y uso de la inteligencia artificial

La tecnología está poniendo en riesgo el cumplimiento de muchos derechos humanos hasta tal punto que la responsable de velar por el respeto de estas garantías fundamentales llega a pedir directamente que se prohíba en aquellos que casos en que no cumplen la normativa internacional.

2021-09-14
Un sistema universal para decodificar cualquier tipo de datos enviados a través de una red.

El nuevo chip elimina la necesidad de un hardware de decodificación específico, podría aumentar la eficiencia de los sistemas de juego, las redes 5G, el Internet de las cosas y más.

2021-09-14
Investigadores granadinos determinan una serie de factores del entorno laboral relacionados con el cáncer

Este hallazgo, publicado en la prestigiosa revista Environment International, podría ayudar a la prevención y determinación de los factores de riesgo de cáncer en el entorno laboral

2021-09-14
La UNLP se suma al desafío de poner satélites en órbita con lanzadores construidos en el país

Ingeniería aportará asistencia técnica y académica para llegar al primer lanzador satelital nacional.