Hoy en día vivimos en un mundo con cada vez más dispositivos inteligentes y conectados junto a una cantidad de datos cada vez mayor. En medio de esta situación surge el reto de entrenar Inteligencia Artificial y modelos de Machine Learning (ML) manteniendo la privacidad del usuario. Estos modelos de Aprendizaje Automático que tan presentes están hoy en día en reconocimiento faciales, fotografía o el corrector de los teclados, necesitan mucha información de los usuarios que se debe mandar a un servidor central y ahí es donde está el problema: Mandar conversaciones o fotografías personales a un servidor para mejorar una aplicación no parece la mejor de las soluciones.

Para solventar este problema surge una nueva tecnología con gran futuro llamada Federated Machine Learning (FML). Esta tecnología consigue entrenar modelos de ML manteniendo en todo momento la privacidad y datos de los usuarios, incluso consiguiendo modelos más eficientes que los conseguidos de la forma usada hasta ahora.

El funcionamiento es el siguiente. En un servidor se crea un modelo de ML, por ejemplo, para el auto corrector del teclado de los dispositivos Android. Este modelo se distribuye a los dispositivos Android de todo el mundo (más de 2000 millones de terminales) para que lo puedan usar. Es aquí donde comienza lo verdaderamente importante. Cada dispositivo entrena el modelo en el propio terminal (On-Device training) mientras que el usuario usa dicho teclado. Según se va prediciendo las palabras y el usuario elige si usarlas o no, el modelo mejora. Una vez que dicho modelo se ha mejorado se procede a mandar una actualización al servidor por parte de cada móvil que contiene pequeñas variaciones de parámetros del modelo, pero ninguna información ni conversación privada. El servidor recibe las pequeñas actualizaciones de estos móviles, los pondera y mejora el modelo de modo que vuelve a mandar un modelo mejorado a todos los dispositivos y el proceso vuelve a empezar.

De esta forma conseguimos tener un teclado auto corrector que aprende de lo que escribe todo el mundo, pero sin que ello conlleve exposición de datos personales, y con la ventaja añadida de que aprovecha la gran cantidad y potencia de los móviles Android del mundo.

La siguiente tabla muestra el estado del arte de las diferentes herramientas para FML del mercado, siendo la más apropiada TensorFlow creada por Google y con una versión aún en fase Alpha (TensorFlowFederated) que permite hacer simulaciones de Aprendizaje Federado y en un futuro usar esta tecnología de forma sencilla. Aún así, como esta herramienta toda vía es muy joven y solo está preparada para simulaciones, no siendo posible crear aplicaciones reales con ella.

Alejandro Aguilera Alcalde ha creado esta entrada como parte de su Trabajo Fin de Titulación, además de una aplicación de ejemplo usando la herramienta TensorFlow Mobile de Google. El código de dicha aplicación está disponible en https://github.com/alejandroaguileraalcalde-ing/FederatedLearnig_Demo

About Jose M. Del Alamo

I am Associate Professor at UPM, affiliated with the Departamento de Ingeniería de Sistemas Telemáticos and the Information Processing and Telecommunications R&D Center. My research work focuses on issues related to privacy, identity and trust management, and considering these aspects to advance the software and systems engineering methodologies applying technological approaches by-design and by-default.

CC BY-NC-ND 4.0 Aprendizaje Automático Federado por jmdelalamo está licenciado bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional.

Leave a Reply

Your email address will not be published.

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>