The Independent Sentinel #09

La descentralización, el aprendizaje federado y los viajes en el tiempo a través de modelos de Machine Learning.

¡Hola!

Soy Javier Fuentes, CEO de Akoios, gracias por leer esta nueva edición de The Independent Sentinel,  la newsletter que hacemos en Akoios para hablar de multitud de temas relacionados con el mundo de los datos y la Inteligencia Artificial.

Si estás leyéndonos por primera vez y aún no estás suscrito, puedes hacerlo aquí:

¡Suscríbete ahora!

En esta edición hablaremos de descentralización, el aprendizaje federado y sobre cómo redescubrir el pasado utilizando la Inteligencia Artificial.

Fuente

¡Empezamos! 🚀


🎼  ¿Quieres banda sonora? ¡Dale al Play!


1. Inteligencia Artificial

Tendencias  📈

De un tiempo a esta parte, se viene hablando de un nuevo tipo de Machine Learning conocido como Federated Learning, que podría ser traducido como Aprendizaje Federado o Aprendizaje descentralizado.

Comencemos por el principio. A día de hoy, los sistemas de Machine Learning que utilizamos, tienen mayoritariamente un enfoque que requiere la centralización de datos, modelos e infraestructuras para su funcionamiento. Este enfoque centralizado tiene un ciclo habitual de desarrollo que resultará familiar para cualquier científico de datos.

Esta centralización ha venido históricamente motivada por necesidades logísticas (manejo y transporte de datos) y de recursos hardware (CPU, memoria) que han cristalizado en las infraestructuras de Machine Learning que conocemos.

Sin entrar en detalle en las diferencias entre los sistemas centralizados y descentralizados (darían para escribir varias ediciones de esta newsletter), podemos afirmar que la creciente capacidad de computación de todo tipo de dispositivos (e.g. los terminales móviles) está abriendo el camino a la distribución de ciertas tareas computacionales “pesadas” que típicamente eran ejecutadas de manera centralizada.

Esta idea de “descentralización” ha dado lugar al término Edge Computing (computación cercana a la fuente de datos). En la siguiente imagen se muestra una evolución histórica de este fenómeno:

Resultado de imagen de cloud computing edge computing decentralization
Fuente: ObjectBox

Desde la perspectiva de los datos, la centralización de los mismos en sistemas de terceros es uno de los problemas recurrentes a los que nos enfrentamos en nuestro ámbito por las obvias preocupaciones relativas a la privacidad de los datos y las restricciones legales y regulatorias sobre los mismos.

Yendo más allá, podemos afirmar que gran parte de los datos no está en “data centers”, sino que está ampliamente distribuida y “descentralizada”, siendo un gran ejemplo de esto toda la información potencialmente adquirible desde nuestro teléfonos móviles.

En cierta medida, los tres aspectos que hemos mencionado arriba y que se resumen en la figura de arriba, han dado las condiciones para esta nueva rama de la Inteligencia Artificial.

En 2016, en este paper preparado por un equipo de Google, se hablaba por primera vez de un acercamiento al Machine Learning llamado Federated Learning para dar respuesta a la siguiente pregunta:

¿Cómo podríamos entrenar un modelo sin necesidad de mover y almacenar los datos de entrenamiento en una ubicación central?

En su opinión la solución a esta cuestión podría ayudar a lidiar con las dificultades de manejar datos sensibles descentralizados usando la creciente capacidad de computación de los terminales móviles para, en definitiva, conseguir entrenar modelos centralizados con datos descentralizados.

En el modelo propuesto por Google, se posibilita que dispositivos móviles puedan compartir colaborativamente un modelo, manteniendo los datos de entrenamiento en cada dispositivo, evitando así su centralización en la Nube.

El funcionamiento es el siguiente:

  • Cada dispositivo descarga el modelo

  • Cada dispositivo mejora el modelo usando los datos locales que tiene disponibles

  • Los dispositivos envían los modelos mejorados a la Nube

  • Se mejora el modelo común con todas las contribuciones y mejoras

El enfoque de Federated Learning de Google. Fuente.

Según estos investigadores, este modelo permitirá hacer mejores modelos, con menor latencia y menor consumo de energía, manteniendo además en todo momento la privacidad de los datos.

Si quieres saber más, puedes echar un vistazo a este artículo donde se habla con más detalle sobre este nuevo paradigma o echar un vistazo a este fantástico webcomic que han hecho en Google para explicar el Federated Learning.

Casos de uso ⚙️

Un caso de uso fantástico de Federated Learning, es su aplicación en el ámbito de la salud, tal y como se cuenta en este artículo de la empresa Nvidia.

Como bien explican, el uso de Federated Learning hace posible que los modelos AI/ML puedan ser entrenados y mejorados usando datos clínicos de multitud de centros sin comprometer la privacidad de los mismos.

Con este enfoque, se posibilita que organizaciones de todo tipo puedan colaborar en el desarrollo de nuevos modelos de manera más ágil compartiendo las mejoras del modelo sin compartir datos.

2. Historias 📔

Redescubriendo el pasado a través de la lA

Gran parte de los modelos de Machine Learning tienen como objetivo hacer una predicción lo más precisa posible sobre el futuro. Pese a ello, la Inteligencia Artificial también nos está ayudando a volver a descubrir el pasado.

Una de la primeras películas de la historia, rodada por los célebres hermanos Lumiére fue la famosa película (¡De 50 segundos!) llamada “L'arrivée d'un train en gare de La Ciotat

Este vídeo es especialmente famoso por la leyenda urbana que le acompaña. Según se contaba, la gente que estaba en el cine huyó despavorida pensando que el tren realmente se dirigía hacía a ellos.

En Febrero de este año, un YouTuber llamado Denis Shiryaev se propuso mejorar la calidad del vídeo utilizando diversas herramientas libremente disponibles como Dain.

Con la ayuda de estas herramientas basadas en Redes Neuronales, ha logrado mejorar la resolución y FPS (Frames Por Segundo) de la película hasta alcanzar una resolución de 4096 líneas y 60 imágenes por segundo. El resultado es sencillamente espectacular:

Si te interesan este tipo de técnicas, puedes echar un vistazo a proyectos como ESRGAN o SFTGAN que, como el propio nombre indica, utilizan las GANs que vimos en TIS#3.

Además de estas mejoras de resolución y FPS, hay otros proyectos interesantísimos centrados en el “coloreado” artificial de imágenes en Blanco y Negro. En este ámbito, uno de los proyectos más conocidos es DeOldify.

Usando nuevamente GANs, este modelo permite colorear todo tipo de imágenes con resultados más que realistas. Mejor verlo con algunos ejemplos:

Migrant Mother
“Migrant Mother” de Dorothea Lange (1936) Fuente

Thanksgiving Maskers
“Thanksgiving Maskers” (1911) Fuente

Opium Real
“Chinese Opium Smokers” (1880) Fuente

Aunque los resultados son fantásticos, no siempre es tarea sencilla mantener una precisión histórica. ¿Realmente la ropa era de esos colores? Un ejemplo muy interesante sobre esto es el ejemplo de la siguiente foto del Golden Gate de San Francisco:

Golden Gate Bridge
“Building the Golden Gate Bridge” (1937) Fuente

Según está documentado, las torres tenían ya el célebre color rojo que conocemos durante la construcción, pero el algoritmo las ha identificado como blancas. Por ello, pese al gran avance de estas técnicas, aún queda mucho camino por recorrer.


👉 Usando nuestra tecnología Titan es más que sencillo convertir este modelo o cualquier otro en un servicio para consumir vía API. Escríbenos a info@akoios.com y te contamos cómo hacerlo. También puedes solicitar un acceso gratuito para probar nuestro producto aquí https://lnkd.in/gPz-2mJ


Al igual que se aplica a imágenes, DeOldify también funciona con vídeos, como se puede ver en esta colorización de la fantástica película Metrópolis de Fritz Lang.

Before Flicker

Un aspecto muy interesante que comenta el creador de DeOldify es que, al ejecutar varios modelos (distintos entre sí) sobre un mismo vídeo o imagen, muchas veces acaba obteniendo resultados muy parecidos.

Según explica, parece que los modelos están detectando patrones sutiles en el blanco y negro, lo que permite obtener resultados deterministas y consistentes.

Si quieres probar DeOldify con alguna foto tuya, puedes usar este servicio gratuito para colorearlas.

Gracias por leernos y muchos ánimos para estos tiempos tan difíciles que estamos viviendo.

¡Un abrazo para todos!


¿Disfrutas con The Independent Sentinel? Ayúdanos a difundir nuestra newsletter. ¡Basta con que compartas nuestra URL!

¿Te has perdido alguna edición? Puedes leer todas aquí:

👉 Si quieres conocer mejor cómo funciona nuestro producto Titan, no te pierdas nuestra serie de tutoriales publicados en Medium.

👉 Si quieres, puedes solicitar un acceso gratuito para probar nuestro producto aquí https://lnkd.in/gPz-2mJ

Loading more posts…