Sin precedentes

El lanzamiento de ChatGPT-4 y de MidJourney v5 dan un salto en la inteligencia artificial sin precedentes. ChatGPT-4 ahora es multimodal. Significa que puede interpretar textos e imágenes. Se ha hecho viral la imagen en la que se ha dibujado con un boli el aspecto de una página web, porque ChatGPT ha creado esa página con código en cuestión de segundos:

El avance es tan loco, que escribir de una semana a otra no acaba de recoger la velocidad exponencial y sin precedentes que lleva esto. Lo último, que Microsoft incorpore en Office 365 ChatGPT-4, tiene unas implicaciones económicas y laborales que le dan la vuelta a todo. En este post cuento mi experiencia al generar contenidos con esta herramienta. También hablo de la versión 5 de MidJourne, la herramienta de inteligencia artificial que hace fotos de una calidad y sofisticación que barren la fotografía tal como la conocemos hasta ahora.

Generación de contenidos

Este título que suena tan abstracto, generación de contenidos, da de comer a muchísimas personas en muchos sectores. Hasta «hace cinco minutos», nuestras redes sociales e internet en general estaban plagados de contenidos generados por redactores de todo tipo. En mi sector, la formación online, el principal trabajo es crear contenido, curar contenido, presentar el contenido de forma pedagógica. Pues todo esto lo hace ChatGPT-4.

Hice la prueba. Había una unidad didáctica de un profesor que estaba de baja, por lo que no podíamos ampliar la información. Le pasé este material a ChatGPT y le pedí un diseño instruccional, es decir, un guion con las instrucciones para crear un curso a partir de una presentación bastante escueta. Lo primero que me pasó fue una estructura completa con todos los puntos necesarios: título del curso, duración, introducción, objetivos pedagógicos, varias secciones, incluida una de práctica, y un apartado de conclusiones. Después le fui pidiendo el desarrollo de cada uno de los puntos. Uno a uno, fue desarrollando cada apartado, yo iba «tomando notas», es decir, copiando lo que me pasaba y pegándolo en un documento. Este único trabajo de copiar y pegar desaparece con la incorporación de ChatGPT a Office: directamente se va a generar el contenido en el formato que queramos, haciendo el proceso todavía más corto, casi instantáneo.

En el apartado de la práctica, me sorprendió porque me presentó el lenguaje de programación para resolver el ejercicio de esta manera:

Imagen con código proporcionada por ChatGPT-4.

Luego recordé que esta herramienta es capaz de generar códigos de páginas web y similares, domina muchos lenguajes de programación e incluso te los puede enseñar como si fueses un niño de 11 años. Es decir:

En resumen: en unos minutos y con distintas preguntas, logré tener un contenido preparado para la formación online. Un contenido perfectamente expresado, sin erratas, con orientación pedagógica. Algo que a cualquiera de mi equipo le habría llevado al menos 2 horas. Y es que este cacharro sabe perfectamente lo que tengo que tener en cuenta para maquetar mi contenido en una de las herramientas de autor habituales, Articulate Rise, y cómo hacer que el alumnado desde casa no se sienta abandonado, sino integrado en un sistema de aprendizaje. Digamos que lo que he aprendido en años y ya puedo destilar en pequeñas píldoras es lo que esta IA me cuenta en cuestión de segundos (y lo aplica a los contenidos que genera, claro):

Hacer fotos sin cámara

La otra gran revolución es la generación de imágenes por inteligencia artificial. En este blog estoy compartiendo imágenes inquietantes generadas por DALL.E-2 y por Lexica Aperture. Pero MidJourney va un paso más allá y genera fotografías de excelente calidad y realismo a partir de textos realmente cortos. Quiero compartir aquí algunos ejemplos que publicó Nick St. Pierre en Twitter recientemente. En este hilo, Nick St. Pierre va comparando el resultado de solicitar una imagen a la versión 4 de MidJourney con respecto a la nueva versión 5. La versión 4 ofrece fotos perfectas, pero con cierto toque inquietante en algunas miradas, mientras que la versión 5 crea fotos perfectas y con un toque de realismo y «sensibilidad» asombroso. Tomemos esta imagen de un mercado:

Imagen de un mercado generada por MidJoruney5, con la sola instrucción: «foto de estilo callejero de un concurrido mercado de la ciudad de Nueva York llena de gente parada junto al mostrador de delicatessen –ar 16:9».

En la imagen que vemos arriba, nada existe. No hay fotógrafo, esas personas no existen, su ropa tampoco, los productos que se ofrecen no están ahí. Es todo generado por una inteligencia artificial.

En esta otra imagen, compara la generación de una mujer en la versión 4 frente a la generación de la versión 5:

Parte del hilo de Nick St. Pierre, donde la petición a la IA es: «foto de estilo callejero de una mujer joven, chaqueta gucci roja, camisa gucci azul, plano general, iluminación natural, soho, filmada en Agfa Vista 200, 4k –ar 16:9».

Simplemente, estoy sin palabras. Estoy totalmente de acuerdo con David Mattin, que en su newsletter 116 comenta que nadie sabe ahora mismo las implicaciones que va a tener todo esto. La adopción es loca, es explosiva, imparable. También comenta lo mismo que comentaba yo la semana pasada: agarrémonos a aquello que nos hace humanos, porque es lo único que nos va a quedar tras este tsunami.

Todo lo demás, cualquier dominio de procedimiento técnico o experiencia, casi todo lo que ahora definimos como «trabajo», está siendo devorado por máquinas. (…) Eso es todo lo que quedará al final de este largo camino que estamos recorriendo con inteligencia artificial: los unos para los otros.

David Mattin