The Independent Sentinel #18

Un homenaje a Dalí, modelos que fallan y el gusano más importante del mundo

¡Hola!

Soy Javier Fuentes, de Akoios, bienvenido a esta primera edición de The Independent Sentinel en 2021, la newsletter en la que hablamos sobre cómo la Ciencia de Datos está cambiando el mundo poco a poco.

Si quieres suscribirte para recibir por correo cada edición, puedes hacerlo aquí:

¡Suscríbete ahora!

En esta edición hablaremos de una increíble aplicación de GPT-3, de modelos que se equivocan y del gusano más importante del mundo.

¡Comenzamos! 🔥


🎼  ¿Quieres banda sonora? ¡Dale al Play!


1. Ciencia de Datos

Casos de uso ⚙️

En los últimos meses seguramente hayas oído hablar de GPT-3 (lo hicimos aquí también en TIS #11) y, tal vez, incluso hayas visto u oído algo sobre lo último de OpenAI: DALL·E.

Dall·e es una versión de 12 billones de parámetros de GPT-3, específicamente entrenada para generar imágenes a partir de textos de manera automática. El nombre viene de la mezcla entre el personaje de Pixar Wall·e y nuestro mundialmente conocido Salvador Dalí.

Su modo de operar es fácil de entender. Utilizando como entrada una cadena de texto, Dall·e es capaz de generar una imagen en función de lo interpretado. En la página de proyecto de OpenAI hay varios ejemplos muy ilustrativos.

Por ejemplo, a partir de este texto de entrada: a pentagonal green clock. a green clock in the shape of a pentagon, Dall·e es capaz de “sintetizar” las siguientes imágenes:

Como se puede ver, el resultado es significativamente bueno, y sorprende la capacidad de Dall·e para entender conceptos y reflejarlos en forma de imagen, haciendo intuir cierta lógica y racionalidad en sus resultados.

Las siguiente figura muestra un resumen de las capacidades demostradas (¡algunas no previstas de antemano!) por el modelo:

Es muy llamativo cómo estas grandes redes alimentadas de forma masiva con datos nos estructurados, son capaces de demostrar esta versatilidad al ser puestas a prueba en tareas complicadas.

Aunque Dall·e no está libremente accesible, se puede jugar con los ejemplos que tienen publicados en su web.

Los detalles del modelo y su entrenamiento aún no son del todo conocidos y serán publicados en un paper que verá la luz en breve. Lo que sí sabemos es que la arquitectura de la red neuronal que utiliza está basada en el modelo Transformer, del que hablaremos detalladamente en otra edición.

Aún estamos lejos de poder hablar de verdadera inteligencia, pero sí que podemos asegurar que las máquinas están haciendo cosas que jamás habíamos visto.

Ética 🤔

En el camino del desarrollo de la IA, no son todo grandes avances y resultados sorprendentes. Por el contrario, los modelos no siempre son tan fiables o robustos como sería deseable y, a menudo, no se comportan igual de bien cuando trabajan con datos reales que no han visto previamente.

En este sentido, la organización Partnership on AI, que aglutina a diversas empresas, instituciones educativas y asociaciones, se dedica a estudiar el impacto de la Inteligencia Artificial en la sociedad y en las personas.

Una de sus iniciativas es la llamada “AI Incident Database”, que recopila fallos de modelos que han sido puestos en funcionamiento.

Algunos de los casos serían dignos titulares para El Mundo Today. Algunos ejemplos:

El portal recopila más de 1000 incidentes y merece la pena echar un vistazo para, al menos, no sentirnos tan mal cuando nuestros modelos no funcionan como esperábamos.

2. Historias 📔

🎲 Determinismo Vs. Libre Albedrío

Como seguro que te pasa a ti también, hay preguntas que se me han planteado recurrentemente a lo largo de mi vida. Una de esas preguntas versa sobre nuestra libertad a la hora de tomar las decisiones.

¿Elegimos nuestras acciones de manera libre y voluntaria o, por el contrario, son causas previas y condicionantes externos los que determinan nuestros actos?

Esta no es ni de lejos una pregunta nueva, es un debate pre-Socrático que lleva siglos siendo discutido en el debate del Libre Albedrío frente al Determinismo.

Esta discusión (en principio filosófica) se ha ido trasladando también al ámbito científico, ya que la ciencia nos está acercando a una posible -aunque aún lejana- respuesta.

🐛 El gusano más importante del mundo

Los lectores más antiguos de The Independent Sentinel, recordarán que ya hablamos de un curioso gusano, el C. Elegans, en una edición anterior.

El Caenorhabditis Elegans es un nematodo de apenas un milímetro de longitud que vive en ambientes templados y que es tremendamente importante para los humanos por varias razones:

  • Es un organismo cuyo genoma es perfectamente conocido.

  • Se dispone de muchísima información sobre su comportamiento.

  • Es transparente, lo que facilita el análisis de sus órganos internos.

Históricamente, el C. Elegans ha sido utilizado como modelo experimental para estudios genéticos. De hecho, fue el primer organismo multicelular del que se tuvo su genoma secuenciado. Por ello, ha sido de muchísima utilidad para estudiar la obesidad, la diabetes, el Alzheimer e incluso el envejecimiento.

Además de todo lo anterior, este gusano tiene una característica muy interesante: Su “sencillo” sistema nervioso está compuesto por únicamente 302 neuronas, de las que, además, se ha “mapeado” su conexión estructural.

🧪 El proyecto OpenWorm

El auge del y abaratamiento de los costes de computación junto con los nuevos métodos y algoritmos que han ido surgiendo en los últimos años, han hecho que se recupere el interés sobre un campo apasionante: Las simulaciones biológicas de gran escala.

En este sentido, el proyecto OpenWorm, fue creado con el objetivo de crear vida artificial y poder simular computacionalmente el comportamiento del C. Elegans.

Los retos principales de este ambicioso proyecto son dos principalmente:

  • Modelar las propiedades neurológicas/eléctricas del cerebro para entender cómo procesa la información.

  • Modelar las propiedades mecánicas del cuerpo del gusano que hacen que se mueva.

El equipo ya dispone de un modelo del cerebro y sus conexiones (lo que se conoce como connectome) en un formato llamado NeuroML, un estándar para describir modelos computacionales de redes de neuronas (biológicas).

Como no podría ser de otro modo, varios modelos de Machine Learning han empezado a ser aplicados para ayudar en el modelado y la simulación de las partes más complejas como, por ejemplo, la simulación del movimiento que hemos mencionado.

El objetivo último de este proyecto y, en general, de este tipo de simulaciones, es avanzar en nuestra comprensión del funcionamiento de sistemas tan extremadamente complejos como el cerebro humano.

🙇 ¿Somos libres?

Haciendo una acrobacia intelectual y llevando al extremo del éxito a la idea planteada en OpenWorm, nos acercaríamos a un escenario ubicado probablemente en la ciencia-ficción.

Si pudiésemos saber a priori cómo actuaría el gusano en función de a) su estado actual y b) las condiciones en su entorno, estaríamos de hecho prediciendo su futuro inmediato 🤯

Esto nos lleva de vuelta a la pregunta de partida y al debate del determinismo frente al libre albedrío para el que aún no tenemos respuesta. Tal vez algún día seamos capaces de entender por completo cómo se rige el universo y, puede que, eventualmente descubramos que estamos en un universo determinista de tal complejidad emergente, que nos genera una ilusión -casi perfecta- de libertad.

¡Gracias como siempre por leer hasta aquí! Hasta pronto 🙋🏻‍♂️


¿Te gusta The Independent Sentinel? ¡Ayúdanos a llegar a más gente compartiendo la newsletter!

Si tienes comentarios o quieres iniciar una conversación, recuerda que puedes hacerlo al final de la publicación.

Si te has perdido alguna edición de la newsletter, puedes leer todas aquí.

👉 ¿Quieres conocer nuestra tecnología Titan? No te pierdas nuestra serie de tutoriales publicados en Medium.

👉 Si te interesa, puedes solicitar un acceso gratuito para probar Titan aquí https://lnkd.in/gPz-2mJ