Llevo unas semanas hablando de inteligencia artificial a pesar de no ser una experta, porque considero que esta explosión de herramientas de IA no tiene precedentes, y me quiero subir al carro. En mi trabajo puedo utilizarlas y solo veo ventajas y un gran potencial. También veo la pérdida inmediata de muchos puestos: en mi equipo ya estamos produciendo contenidos audiovisuales gracias a estas herramientas y mi sensación es que van a ir a más.
Herramientas de IA
Hagamos un repaso a las herramientas de inteligencia artificial que están disponibles y cualquier persona puede utilizar:
Para generar textos:
- ChatGPT: herramienta desarrollada por OpenAI y cuyo uso se ha extendido hasta los 100 millones de usuarios. Se trata de un chat, una conversación, con un software de IA que responde preguntas generando (es decir, creando) respuestas a partir de la información con la que se ha entrenado. Sus usos son infinitos: cualquier texto de cualquier tipo que se quiera generar, ChatGPT lo hace en segundos.
- Perplexity: como su nombre indica, esta herramienta te deja en la peplejidad. Funciona de manera similar a ChatGPT pero con menos inventiva, es decir, se nutre de fuentes aparentemente fidedignas y las cita en el resultado que ofrece.
Para generar imágenes:
- DALL.E 2: esta herramienta crea ilustraciones a partir de un texto sugerido. Es anterior a ChatGPT, también de OpenAI. Su éxito quizá no era tanto porque las ilustraciones siguen siendo como «dibujos», algunas bastante siniestras, en lugar de ser realistas.
- Lexica Aperture: es una herramienta competidora de DALL.E y que genera imágenes más realistas. Funciona igual, traduce una descripción de texto en una imagen. También se puede aportar qué no se quiere que aparezca en ella.
Para generar locuciones y vídeos:
- Prime Voice AI: es la herramienta de ElevenLabs que ha causado tanto revuelo por su grado de perfección. La lectura del Gran Gatsby suena a un locutor profesional, mientras que la imitación de la voz de Emma Watson leyendo el Mein Kampf hizo que se limitara el uso a usuarios de pago.
- Video Library: es una herramienta que permite crear vídeos con un avatar hablando en el idioma del texto que se proporciona. El avatar puede ser totalmente realista, es decir, puede parecer una persona. En el resultado se da cierto efecto de valle inquietante, es decir, no lograr el parecido máximo con el ser humano produce cierto rechazo.
- Synthesia: esta herramienta también permite hacer vídeos por inteligencia artificial, cambiando el fondo y generando un avatar de una persona real. Además, permite entrenar a la IA para generar una voz a partir de otra voz que se le proporciona. El resultado es difícilmente distinguible de la persona real, como puedes ver en este artículo.
Trabajos perdidos
Si he dedicado tiempo a recopilar las inteligencias artificiales que he probado (esto significa que hay muchos más productos y que cada día aparece algo nuevo), es porque sus capacidades ya apuntan a los empleos que peligran de forma más inmediata.
Hace realmente muy poco tiempo, compartí en este blog el vídeo de los robots y el tipo de trabajos que peligran: los que contienen tareas repetitivas que se pueden sistematizar fácilmente. Esto parecía dejar libre el espacio de la creación y de trabajos «más elevados», pero no es así.
El refinamiento de las herramientas de generación de texto es tanto que reduce considerablemente los tiempos necesarios para generar cualquier tipo de contenido. Esto pone en peligro los trabajos de escritura no artística: copy, redactor, escritor de discursos, guionista, diseñador instruccional… por mencionar algunos. Como explicaba hace unas semanas, los textos que generan estas inteligencias basadas en modelos de aprendizaje del lenguaje (learning language models o LLMs en inglés) no tienen erratas y están correctamente redactados.
La revolución comenzó, sin embargo, por las herramientas de generación de imágenes: los diseñadores gráficos vieron peligrar sus puestos cuando una obra de arte pintada por una inteligencia artificial, Midjourney, ganó el premio de pintura digital de la feria de arte de Colorado. Siendo anteriores estas herramientas, los resultados a veces son peores: muchas imágenes que genera DALL.E son siniestras y parecen proceder de pesadillas. Por ejemplo:

En cuanto a la generación de locuciones y vídeos, peligran trabajos de actores y locutores para muchos terrenos alejados de las grandes producciones: anuncios, videoclips, vídeos corporativos, vídeos de aprendizaje… Solo hay que ver esta noticia en la que se pide a actores y actrices firmar la cesión de su voz para entrenar a una inteligencia artificial y producir más contenido con ella.
Es verdad que hemos visto a un Tom Cruise indistinguible del real en un vídeo en el que se superpone su cara y voz sobre otro actor. También hemos visto sustituciones de actores que han muerto durante el rodaje, como el caso del protagonista de El cuervo, Brandon Lee. Pero hasta ahora, parecían juegos o utilidades aplicables en caso de necesidad extrema. Sin embargo, pensemos en actores y actrices que no conocemos. Si recupero el ejemplo que he citado antes, cómo Chris Lavigne es capaz de generar un avatar de sí mismo con su propia voz que es indistinguible del Chris Lavigne real, entonces podemos atisbar la pérdida de muchísimo trabajo de interpretación.
Voy ahora más allá: en una formación 100 % en línea, en la que el alumnado no ve al docente si no a través de vídeos, chats y foros, ¿por qué no se va a sustituir a una persona por esta generación de textos, audios y vídeos? Se entiende que el docente tiene unos conocimientos pedagógicos que no se pueden sustituir… ¿o sí? Se puede entrenar a una IA para que tenga estos conocimientos pedagógicos y responda a lo que le plantea el alumnado. Ya he puesto también algún ejemplo en el que ChatGPT escribe preguntas de test mejor que muchas personas, y llevo años redactando y leyendo preguntas de test.
Ayer escuché a la niña pequeña de los vecinos pidiendo cuentos a Alexa de la forma más natural. Alexa iba contando cuentos con una perfecta entonación. Quizá para esa niña, que no pasará de los 5 años, la convivencia con las IA será tan natural que no le parecerá extraño trabajar, por ejemplo, en el diseño de preguntas adecuadas para que la IA dé lo máximo en la generación de su respuesta. O bien trabajar entrenando una voz nueva, un rostro nuevo, de una persona que no existe. A veces parece que hemos llegado al futuro de golpe. Y es lo que me parece ahora.
¿Cuál es tu experiencia? ¿Hablas con Alexa, Siri o con Google? ¿Qué opinas de las creaciones generadas por la inteligencia artificial? Como siempre, muchas gracias por leer y por compartir.