Cómo la IA puede ayudar a potenciar la creatividad
INTELIGENCIA ARTIFICIAL. Tiempo de lectura: 20 minutos.
Olvídate de la creatividad de un solo clic. Estos artistas y músicos están encontrando nuevas formas de crear con IA, incorporando fricción, desafío y azar al proceso.
A veces, Lizzie Wilson aparece en una fiesta rave con su compañero de IA.
Una noche de febrero de entresemana, Wilson conectó su portátil a un proyector y vio su pantalla reflejada en la pared de un pequeño loft de techo bajo, en la zona este de Londres. Bajo una luz tenue y rosada, un pequeño grupo personas se acomodó en silencio. Entonces, Wilson se sentó y comenzó a programar.
Los altavoces emitían clics y silbidos tecno. El público observaba, mientras asentía con la cabeza, cómo Wilson tecleaba el código en la pantalla proyectada, línea por línea. Modificaba los sonidos, ponía ritmos en bucle y se expresaba con mala cara cuando se equivocaba.
Wilson es una «live coder«. En lugar de utilizar software específico, como la mayoría de los productores de música electrónica, los live coders crean música escribiendo el código para generarla sobre la marcha. Se trata de un arte escénico improvisado conocido como «algorave«.
«Es aburrido ir a un espectáculo y ver a alguien sentado en su portátil», dice. «Puedes disfrutar de la música, pero falta el lado performativo. Con la codificación en directo, todo el mundo puede ver lo que estoy tecleando. Y cuando una vez se me cuelga el portátil, a la gente le gusta mucho. Se ponen a aplaudir».
Asumir riesgos forma parte del ambiente. Por eso, a Wilson le gusta subir un nivel más en sus actuaciones recurriendo a lo que ella llama un agente de codificación en directo, un modelo generativo de inteligencia artificial que crea sus propios ritmos y bucles para añadirlos a la mezcla. A menudo, el modelo sugiere combinaciones de sonidos en las que Wilson no había pensado. «Tienes elementos sorpresa», dice. «Sólo tienes que ir a por ello».
Adela Festival.
Wilson, investigadora del Creative Computing Institute de la Universidad de las Artes de Londres (Reino Unido), es una de los muchos que trabajan en lo que se conoce como cocreatividad o creatividad más humana. La idea es que la IA pueda utilizarse para inspirar o criticar proyectos creativos, ayudando a las personas a hacer cosas que no habrían hecho por sí mismas. Ella y sus colegas crearon el agente de codificación en vivo para explorar cómo puede utilizarse la inteligencia artificial para apoyar los esfuerzos artísticos humanos; en el caso de Wilson, la improvisación musical.
Es una idea que va más allá de lo que prometen hoy las herramientas generativas de empresas como OpenAI o Google DeepMind. Sí, estas tecnologías pueden automatizar un montón de tareas creativas y darnos resultados casi al instante… pero, ¿a qué precio? Algunos artistas e investigadores temen que nos conviertan en consumidores pasivos de más y más contenido generado por IA, sin alma ni profundidad.
Por eso buscan formas de devolver la creatividad humana al proceso. El objetivo es desarrollar herramientas de inteligencia artificial que aumenten nuestra creatividad en lugar de despojarnos de ella -impulsándonos a ser mejores componiendo música, desarrollando juegos, diseñando juguetes y mucho más- y sentar las bases de un futuro en el que humanos y máquinas creen cosas juntos.
En última instancia, los modelos generativos podrían convertirse en una nueva forma de expresión para artistas y diseñadores, desafiándolos a crear cosas que antes eran impensables. Incluso podrían darle a cualquiera una especie de “superpoder creativo”.
Explosión de creatividad.
No hay una única forma de ser creativos, pero lo somos todos. Creamos de todo: desde memes hasta obras maestras, desde los primeros garabatos de la infancia hasta diseños industriales. Existe una idea equivocada—sobre todo entre adultos—de que la creatividad es algo que se pierde con el tiempo. Ser creativos—ya sea cocinando, cantando en la ducha o armando TikToks rarísimos—es algo que la mayoría seguimos haciendo, simplemente por diversión. No tiene que ser arte elevado ni una idea que cambie el mundo (aunque podría serlo). La creatividad es un comportamiento humano básico, y deberíamos celebrarlo y fomentarlo.
Cuando llegaron los modelos generativos de texto a imagen, como Midjourney, DALL·E de OpenAI o el popular Stable Diffusion de código abierto, provocaron una explosión de lo que parecía ser pura creatividad. De repente, millones de personas podían crear imágenes sorprendentes de casi cualquier cosa y en cualquier estilo, con solo hacer clic en un botón. Luego aparecieron los modelos de texto a video. Y ahora, start-ups como Udio están desarrollando herramientas similares para crear música. Nunca antes el acto de crear había estado al alcance de tantas personas.
Pero para muchos investigadores y artistas, el entusiasmo que rodea a estas herramientas ha distorsionado la idea de lo que realmente significa ser creativo. «Si le pido a una IA que cree algo por mí, eso no es ser creativo«, explica Jeba Rezwana, experta en cocreatividad en la Universidad de Towson (Maryland, EE UU). «Es una interacción de una sola vez: haces clic, se genera algo y ya está. No puedes decir ‘me gusta esta parte, pero cambia un poco esto otro’. No se puede tener un diálogo de ida y vuelta».
Rezwana se refiere a la forma en que están diseñados la mayoría de los modelos generativos. Es cierto que puedes darles indicaciones y pedirles que lo intenten de nuevo, pero cada nuevo resultado se genera desde cero, lo que dificulta conseguir exactamente lo que tenías en mente. Como dijo el cineasta Walter Woodman el año pasado, después de que su colectivo artístico Shy Kids hiciera un cortometraje usando el modelo de texto a video de OpenAI por primera vez: “Sora es como una máquina tragamonedas—nunca sabes bien qué te va a devolver”.
Es más, las últimas versiones de algunas de estas herramientas generativas ni siquiera utilizan el mensaje enviado tal cual para producir una imagen o un vídeo (al menos, no con la configuración predeterminada). Antes de enviar el mensaje al modelo, el software lo edita -a menudo añadiendo docenas de palabras ocultas- para que la imagen generada parezca más pulida.
«Se añaden cosas extra para exprimir el resultado», dice Mike Cook, investigador de creatividad computacional del King’s College (Londres, Reino Unido). «Intenta pedirle a Midjourney que te dé un mal dibujo de algo: no puede hacerlo». Estas herramientas no te dan lo que quieres, sino lo que sus diseñadores creen que quieres.
Cortesía de Mike Cook.
Todo esto está muy bien si sólo necesitas una imagen rápida y no te importan demasiado los detalles, dice Nick Bryan-Kinns, también del Creative Computing Institute: «Quizá quieras hacer una tarjeta de Navidad para tu familia o un folleto para la venta de pasteles de tu comunidad. Estas herramientas son estupendas para eso».
En resumen, los modelos generativos existentes han facilitado la creación, pero no han facilitado la creatividad. Y hay una gran diferencia entre ambas cosas. Para el investigador Cook, depender de estas herramientas podría, de hecho, perjudicar el desarrollo creativo de las personas a largo plazo. «Aunque muchos de estos sistemas de IA creativa se promocionan como una forma de hacer la creatividad más accesible», escribió en un artículo publicado el año pasado, «podrían tener efectos negativos sobre los usuarios, limitando su capacidad de innovar, generar ideas y crear». Que estas herramientas, tan celebradas por poner la creatividad al alcance de todos, puedan terminar logrando lo contrario, es una advertencia seria.
En el videojuego Disc Room, los jugadores deben moverse dentro de una habitación llena de sierras circulares en movimiento. /
Cook usó IA para diseñar un nuevo nivel del juego. El resultado fue una habitación en la que, curiosamente, ninguna de las sierras se movía.
Cook no es el único investigador preocupado por el impacto cognitivo de estas tecnologías. En febrero, un equipo de Microsoft Research Cambridge publicó un informe en el que concluía que las herramientas de IA generativa «pueden inhibir el compromiso crítico con el trabajo y conducir potencialmente a una dependencia excesiva de la herramienta a largo plazo y a una disminución de la habilidad para resolver problemas de forma independiente». Los investigadores descubrieron que, con el uso de herramientas generativas, el esfuerzo de las personas «se desplaza de la ejecución de tareas a la administración de tareas».
A Cook le preocupa que las herramientas generativas no permiten equivocarse, y eso es clave para aprender nuevas habilidades. Tenemos la costumbre de decir que los artistas «tienen un don», explica. Pero la realidad es que los artistas trabajan su arte: desarrollan sus capacidades con práctica, a lo largo de meses y años.
«Si hablas con artistas de verdad, te dicen: ‘Me volví bueno repitiendo una y otra vez’», comenta. «Pero fracasar duele. Y siempre estamos buscando formas de evitarlo.»
Los modelos generativos nos permiten saltarnos la frustración de hacer un mal trabajo.
«Desgraciadamente, estamos eliminando lo único que hay que hacer para desarrollar habilidades creativas por uno mismo, que es fracasar«, dice Cook. «Pero absolutamente nadie quiere oír eso».
Sorpréndeme.
Sin embargo, no todo son malas noticias. Artistas e investigadores están entusiasmados con la forma en que las herramientas generativas pueden ayudar a los creadores, orientándolos hacia nuevas y sorprendentes direcciones y alejándoles de callejones sin salida. Cook cree que la verdadera promesa de la IA será ayudarnos a mejorar en lo que queremos hacer en lugar de hacerlo por nosotros. Para ello, dice, necesitaremos crear nuevas herramientas, diferentes de las que tenemos ahora. «Utilizar Midjourney no hace nada por mí, no cambia nada de mí», afirma. «Y pienso que eso es una oportunidad perdida».
Si preguntamos a los investigadores de la creatividad por un elemento clave del proceso creativo, muchos responderán: la reflexión. Es difícil de definir con exactitud, pero la reflexión es un tipo particular de pensamiento centrado y deliberado. Es lo que ocurre cuando se te ocurre una idea nueva. O cuando una suposición resulta ser errónea y hay que replantearse el enfoque. Es lo contrario de una interacción aislada.
Buscar formas en las que la IA pueda apoyar o fomentar la reflexión -pidiéndole que aporte nuevas ideas a la mezcla o que cuestione las ideas que ya tienes- es un hilo común en toda la investigación sobre cocreatividad. Si herramientas generativas como DALL-E permiten crear sin fricciones, el objetivo aquí es volver a añadir fricciones. «¿Cómo podemos hacer arte sin fricción?», se pregunta Elisa Giaccardi, que estudia diseño en la Universidad Politécnica de Milán (Italia). «¿Cómo podemos participar en un proceso verdaderamente creativo sin un material que nos empuje hacia atrás?».
Tomemos el agente de live-coding de Wilson. Ella afirma que este la impulsa a llevar su improvisación musical hacia direcciones que quizás no hubiera explorado por sí misma. Entrenado con código público compartido por la comunidad más amplia de live-coding, el modelo sugiere fragmentos de código más cercanos al estilo de otras personas que al suyo propio. Esto hace que sea más probable que produzca algo inesperado. «No porque no pudieras hacerlo tú misma», dice. «Pero la forma en que funciona el cerebro humano es que tendemos a recurrir a ideas repetidas.»
El año pasado, Wilson participó en un estudio dirigido por Bryan-Kinns y sus colegas en el que encuestaron a seis músicos experimentados mientras utilizaban diversos modelos generativos para ayudarles a componer una pieza musical. Los investigadores querían saber qué tipo de interacciones con la tecnología resultaban útiles y cuáles no.
Todos los participantes dijeron que les gustaba cuando los modelos hacían sugerencias sorprendentes, incluso cuando esas eran el resultado de fallos o errores. A veces, los resultados eran simplemente mejores. Otras veces, el proceso se sentía fresco y emocionante. Pero algunos tuvieron dificultades para ceder el control. Les costaba dirigir los modelos para que produjeran resultados específicos o para repetir los que les habían gustado. «De alguna manera, es como estar en una banda», comenta Bryan-Kinns. «Necesitas tener esa sensación de riesgo y sorpresa, pero no quieres que sea totalmente aleatorio.»
Diseños alternativos.
Cook aborda la sorpresa desde otro ángulo: busca obtener ideas inesperadas a partir de herramientas de IA que él mismo ha desarrollado para cocrear videojuegos. Una de ellas es Puck, lanzada por primera vez en 2022, que genera diseños de juegos de puzles simples, del estilo Candy Crush o Bejeweled. Muchos de los diseños que crea Puck son experimentales y poco pulidos—no esperes que genere algo que realmente quieras jugar. Pero ese no es el objetivo: Cook utiliza Puck, y otra herramienta más reciente llamada Pixie, para explorar qué tipo de interacción podrían querer tener las personas con una herramienta de creación colaborativa.
Pixie puede leer el código de un videojuego y modificar algunas líneas para proponer diseños alternativos. Hace poco, Cook estaba trabajando con una copia de un juego popular llamado Disc Room, en el que los jugadores deben cruzar una sala llena de sierras giratorias en movimiento. Le pidió a Pixie que lo ayudara a diseñar un nivel que resultara igual de difícil tanto para jugadores expertos como para los novatos. La propuesta de Pixie fue una sala donde, curiosamente, ninguna de las sierras se movía. Cook se ríe: no era lo que esperaba. «Básicamente convirtió la sala en un campo minado», cuenta. «Pero me pareció muy interesante. Nunca se me habría ocurrido.»
Madre Arzberger. Cortesía de Anne Arzberger. / Un unicornio relleno y materiales de costura. Cortesía de Anne Arzberger.
Rebatir suposiciones o ser cuestionado forma parte del proceso creativo, afirma Anne Arzberger, investigadora de la Universidad Tecnológica de Delft (Países Bajos). «Si pienso en las personas con las que mejor he colaborado, no son las que se limitan a decir ‘Sí, genial’ a todas las ideas que les propongo», afirma. «Eran realmente críticos y tenían ideas opuestas».
Arzberger quiere crear una tecnología que sirva de caja de resonancia. Como parte de un proyecto llamado Creating Monsters , Arzberger desarrolló dos herramientas experimentales de IA que ayudan a los diseñadores a encontrar prejuicios ocultos en sus diseños. «Me interesaba saber cómo podía utilizar esta tecnología para acceder a información a la que de otro modo sería difícil acceder», afirma.
Para el proyecto, ella y sus colegas analizaron el problema de diseñar figuras de juguete que fueran neutras en cuanto al género . Ella y sus colegas (incluido Giaccardi) utilizaron Teachable Machine , una aplicación web creada por investigadores de Google en 2017 que facilita el entrenamiento de tu propio modelo de aprendizaje automático para clasificar diferentes entradas, como imágenes. Entrenaron este modelo con algunas docenas de imágenes que Arzberger había etiquetado como masculinas, femeninas o neutras.
Luego, Arzberger le pidió al modelo que identificara el género de nuevos diseños de juguetes. Descubrió que varios de ellos eran clasificados como femeninos, incluso cuando ella había intentado que fueran neutrales. Sintió que, de algún modo, sus propias creencias —sus sesgos inconscientes— estaban saliendo a la luz. Pero lo más interesante fue que el modelo muchas veces tenía razón: puso a prueba sus ideas preconcebidas y ayudó al equipo a mejorar los diseños. Según Arzberger, este enfoque podría aplicarse también para evaluar todo tipo de características en el diseño.
Luego, Arzberger utilizó un segundo modelo, una versión de una herramienta creada por la start-up de imagen y vídeo generativos, Runway, para crear sus propios diseños de juguetes de género neutro. En primer lugar, los investigadores entrenaron al modelo para generar y clasificar diseños de juguetes de aspecto masculino y femenino. A continuación, pudieron pedir a la herramienta que encontrara un diseño que estuviera exactamente a medio camino entre los diseños masculinos y femeninos que había aprendido.
Los modelos generativos pueden aportar observaciones sobre los diseños que los propios diseñadores humanos podrían pasar por alto, asegura Arzberger. «Podemos aprender mucho de ellos», dice.
Tomar el control.
La historia de la tecnología está llena de avances que transformaron la forma en que se crea arte, desde nuevas fórmulas para obtener colores vibrantes en la pintura hasta la fotografía y los sintetizadores. En los años 60, el investigador de Stanford John Chowning pasó años trabajando en un algoritmo complejo que podía manipular las frecuencias de los sonidos generados por ordenador. Stanford concedió la licencia de la tecnología a Yamaha, que la incorporó a sus sintetizadores – incluido el DX7, el nuevo sonido de moda detrás de éxitos de los 80 como «The Best» de Tina Turner, «Take On Me» de A-ha y «When Doves Cry de Prince.
Bryan-Kinns está fascinado por cómo los artistas y diseñadores encuentran formas de usar nuevas tecnologías. «Si hablas con artistas, la mayoría no se refiere a los modelos generativos de IA como una herramienta —hablan de ellos como si fueran un material artístico, como la pintura o la arcilla», cuenta. «Es otra manera de pensar qué es lo que hace realmente la IA.» Él destaca cómo algunas personas están llevando esta tecnología a terrenos insospechados, haciéndola hacer cosas raras para las que no fue pensada. Según dice, los artistas suelen apropiarse de estas herramientas y usarlas «a su manera», incluso forzándolas o torciéndolas un poco.
Bryan-Kinns menciona el trabajo de Terence Broad, un colega suyo en el Creative Computing Institute, como uno de sus ejemplos favoritos. Broad utiliza técnicas como el network bending, que consiste en meter capas nuevas dentro de una red neuronal para crear efectos visuales tipo glitch en las imágenes generadas, o entrenar un modelo sin datos directamente, lo que da como resultado manchas de color abstractas que recuerdan a los cuadros de Rothko.
Pero Broad es un caso extremo. Bryan-Kinns lo resume así: «El problema es que existe un abismo entre las herramientas generativas muy comerciales, que producen resultados de altísima calidad, pero con muy poco control sobre lo que hacen, y el otro extremo, en el que se tiene un control total sobre lo que hacen, pero las barreras de uso son altas porque hay que ser alguien que se sienta cómodo metiéndose bajo el capó del ordenador».
«Es un número muy pequeño de personas», dice. «Es un número muy pequeño de artistas».
Arzberger admite que trabajar con sus modelos no fue nada sencillo. Ejecutarlos llevaba varias horas, y ni siquiera está segura de que la herramienta de Runway que usó siga disponible. Tanto ella como Bryan-Kinns, Cook y otros investigadores quieren llevar este tipo de interacciones creativas que están descubriendo hacia herramientas que puedan ser utilizadas por personas que no sean programadoras expertas.
Terence Broad. Cortesía de Terence Broad / Imagen de campo de color generada por IA. Cortesía de Terence Broad.
Encontrar el equilibrio justo entre sorpresa y control no va a ser fácil. Midjourney, por ejemplo, puede sorprender, pero ofrece muy pocas formas de controlar lo que produce más allá del prompt que se le da. Hay quienes dicen que escribir prompts es, en sí mismo, un acto creativo. «Pero nadie se pelea con un pincel como se pelea con un prompt«, dice Cook.
Frente a esa lucha, Cook a veces observa a sus estudiantes conformarse con los primeros resultados que les da una herramienta generativa. «Me interesa mucho esta idea de que nos estamos preparando para aceptar que lo que salga de un modelo es exactamente lo que pedimos«, comenta. Actualmente, está diseñando un experimento que variará palabras y frases en prompts similares para probar cuán grande es la discrepancia entre lo que la gente espera y lo que realmente obtiene.
Pero aún es pronto. Mientras tanto, las empresas que desarrollan modelos generativos suelen dar más importancia a los resultados que al proceso. «Los avances algorítmicos son impresionantes, pero muchas veces se pasa por alto el diseño de la interacción», afirma Rezwana.
Para Wilson, la elección crucial en cualquier relación de cocreación es lo que haces con lo que te dan. «Tienes una relación con el ordenador en la que intentas mediar», afirma. «A veces sale mal, y eso forma parte del proceso creativo».
Cuando la IA te da limones, haz arte. «¿No sería divertido tener algo completamente antagónico en una actuación, algo que te llevara la contraria y tuvieras una especie de discusión? «Eso sería interesante de ver, al menos».
Por: Will Douglas Heave.
Sitio Fuente: MIT Technology Review