El experimento: por qué este artículo
Cuando sale algo nuevo, lo pruebo. Pero no con ejemplos genéricos. Con material real.
Llevaba días viendo en LinkedIn cómo todo el mundo probaba el nuevo modelo de imágenes de ChatGPT con ejemplos decorativos. Paisajes, retratos, ilustraciones bonitas.
Eso no me dice nada.
Lo que me dice algo es probarlo con un problema real. Con contenido que ya existe. Con algo que tenga estructura, profundidad, capas de significado. Para ver si el modelo es capaz de leer todo eso y traducirlo a algo visual que funcione.
El material más obvio era mi último artículo publicado: el del sistema nervioso de IA para empresas. Un artículo denso, con arquitectura conceptual, con 10 secciones bien diferenciadas, con diagramas, con datos y con una tesis central clara.
Le dije a ChatGPT: tengo este artículo, quiero ver si eres capaz de convertirlo en distintos tipos de visualizaciones. Vamos a jugar.
Y así empezó.
Cómo le hablé: conversación, no prompt
No fui con un documento técnico de requisitos. Fui hablando.
Yo no uso prompts. No me siento a redactar instrucciones precisas con temperatura, tono, formato de salida y restricciones. Eso me aleja de cómo pienso.
Hablo. Le cuento qué quiero ver. Le doy contexto. Le digo si algo no me gusta y por qué. Lo empujo en la dirección que me interesa. Y cuando algo sale bien, le pido más de eso.
La diferencia entre alguien que "no le funciona la IA" y alguien que saca resultado real no está en los prompts. Está en si saben mantener una conversación con el modelo.
La sesión empezó con una conversación sobre el artículo. Le expliqué la idea central del sistema nervioso de IA, por qué usaba esa metáfora, qué audiencia tenía el artículo, qué quería comunicar.
Después le fui pidiendo formatos. Cada vez que algo salía, lo comentaba. Le decía qué me gustaba, qué cambiaría, qué quería explorar. La sesión fue creciendo sola.
Al final llevaba más de una hora jugando. Y tenía ocho visualizaciones distintas del mismo contenido, cada una con su propio lenguaje visual y su propia audiencia objetivo.
Los 8 formatos que salieron
El mismo concepto, ocho lenguajes visuales completamente distintos.
Le pedí que dibujara el concepto como si fuera una nota rápida a mano, con el estilo de alguien que piensa en voz alta sobre papel. Quería ver si era capaz de capturar la arquitectura del sistema nervioso de forma orgánica, sin la rigidez de un diagrama técnico.
Lo que salió fue exactamente eso: trazos irregulares, flechas conectando nodos, texto manuscrito, la sensación de estar viendo el pensamiento en proceso. Es el formato que mejor funciona para explicar sistemas complejos a equipos no técnicos.
"Quiero ver esto como un sketchnote, como si alguien lo hubiera dibujado a mano mientras pensaba. Informal, con flechas, con anotaciones. Que se note que es un sistema vivo, no una presentación corporativa."
Este fue el primero que me sorprendió de verdad. Le pedí algo entre un mapa estratégico y un plano técnico de ingeniería. La idea era representar el sistema como si fuera un dispositivo físico diseñado para fabricarse, con dimensiones, materiales y secciones transversales.
El resultado tiene ese look de documento técnico industrial que hace que cualquier concepto abstracto parezca real y construible. Muy útil para clientes que vienen de entornos de ingeniería o manufactura.
"Ahora quiero lo contrario. Algo muy técnico, como un plano de ingeniería con medidas y secciones, como si fuera un dispositivo físico que alguien va a fabricar. Con leyenda de materiales y todo."
El formato más clásico. Le pedí el diagrama que yo usaría en una presentación para un CEO: blanco, limpio, con los nodos principales del sistema y las conexiones entre ellos. Sin ruido. Sin decoración innecesaria.
Es el formato más útil para documentación interna y para el primer contacto con un cliente nuevo que necesita entender la arquitectura antes de entrar en detalles.
"Ahora el diagrama de flujo clásico. Blanco, limpio, con los nodos principales y las flechas de conexión. Que quepa en una diapositiva y que cualquiera lo entienda a primera vista."
Le pedí que convirtiera el artículo en algo accionable: una checklist por capa del sistema, con los elementos clave que no pueden faltar. Formato de dos columnas, denso de información, diseñado para imprimirse y usarse.
Me gustó que entendió la diferencia entre una checklist decorativa y una checklist que alguien va a usar de verdad. Los ítems tienen el nivel de concreción correcto.
"Quiero una checklist. Algo que alguien pueda imprimir y usar. Dos columnas, cada capa del sistema con sus ítems específicos. Que sirva de verdad."
Aquí empezó lo que me flipó. Le pedí que lo convirtiera en un dashboard de monitorización en tiempo real: fondo oscuro, métricas, alertas, gráficos de actividad. Como si el sistema nervioso de la empresa fuera algo que alguien está monitorizando ahora mismo.
Para mí este es el formato más potente para comunicar que la IA no es un proyecto puntual, sino infraestructura viva que alguien tiene que operar.
"Ahora quiero un dashboard dark. Como una consola de control real. Con alertas, métricas en tiempo real, gráficos. Que parezca que alguien está monitorizando el sistema ahora mismo."
La versión opuesta: el mismo dashboard pero con el estilo de una aplicación SaaS moderna. Fondo blanco, sidebar de navegación, KPIs en la parte superior. Como si "AI OS" fuera un producto real que alguien ya está usando.
Lo interesante es que el modelo mantuvo coherencia conceptual entre los dos dashboards. Los mismos datos, la misma arquitectura, dos lenguajes visuales completamente distintos.
"Ahora lo mismo pero blanco. Estilo app SaaS. Con sidebar, con la navegación a la izquierda, como si fuera un producto real que ya existe y la gente ya está usando."
Le pedí un instrumento de diagnóstico: un radar que permitiera a cualquier empresa medir en qué punto está su sistema nervioso de IA. Con los 5 ejes del sistema, con niveles del 1 al 5, con la ruta para subir de nivel.
Este formato convierte el artículo en algo que el lector puede aplicar directamente a su empresa. No es información pasiva. Es una herramienta.
"Quiero un radar de madurez. Que una empresa pueda ver dónde está ahora mismo en cada dimensión del sistema nervioso. Con niveles claros y con la ruta de mejora."
El más inesperado y el que más me hizo reír. Le pedí que convirtiera el diagnóstico del sistema nervioso en un informe médico real. Con el formato de un hospital: identificador de paciente, estado general del sistema, síntomas principales, diagnóstico, tratamiento recomendado y próximo paso.
Surgió de una conversación en los comentarios del artículo anterior: alguien señaló el problema de la resistencia humana a compartir conocimiento. Usé este formato para responderle. La metáfora funciona perfectamente: la empresa enferma, el sistema nervioso fragmentado, el tratamiento por fases.
"Y ahora la más loca. Quiero esto como un informe médico de verdad. Que la empresa sea el paciente. Con estado del sistema, síntomas, diagnóstico, tratamiento. Todo con el formato de un hospital."
Lo que me ha flipado
Sin exagerar y sin hype. Lo que funciona de verdad.
Tres cosas me han sorprendido en esta sesión.
La comprensión del contenido. El modelo no solo "decoró" el artículo. Entendió la arquitectura conceptual. Supo qué era un nodo principal, qué era un flujo de datos, qué era el sistema de feedback. Eso se nota en los resultados: no hay errores conceptuales, no hay inventos. Las visualizaciones son fieles al contenido original.
La coherencia entre formatos. Ocho visualizaciones distintas del mismo concepto y todas son reconocibles como parte del mismo sistema. Los nombres de los componentes son consistentes, la arquitectura es la misma, los datos se mantienen. Eso no es fácil de conseguir en una sesión larga con un modelo generativo.
La velocidad. En algo más de una hora generé material visual suficiente para un mes de contenido. Cada imagen sirve para un canal distinto, una audiencia distinta, un objetivo distinto. El tiempo de producción cayó a niveles que hace un año eran imposibles sin equipo de diseño.
Lo que más me ha sorprendido
El formato de diagnóstico médico. No lo tenía planeado. Surgió en la conversación cuando le pedí algo inesperado. Y fue lo que más impacto visual tuvo. Eso me dice que el modelo tiene capacidad creativa real cuando se le da espacio para sorprender.
Lo que no me ha convencido
Sin hype. Los límites reales que encontré.
También hay cosas que no funcionaron.
Los textos dentro de las imágenes. El modelo comete errores tipográficos en formatos con mucho texto. Palabras cortadas, caracteres extraños, inconsistencias entre bloques. En formatos como el diagnóstico médico o el radar de madurez hay que revisar el texto letra a letra. No es un bloqueante, pero es trabajo extra.
La iteración fina es difícil. Cuando algo no me gustaba y pedía un ajuste concreto, el modelo tendía a regenerar la imagen completa en lugar de modificar solo el elemento señalado. Para ajustes quirúrgicos hay que exportar y editar manualmente.
El estilo es el estilo del modelo. Todas las imágenes tienen una estética reconocible como "generada con ChatGPT". Los colores, las tipografías, los estilos de iconografía. Hay un techo estético que no se puede cruzar sin pasar por herramientas de diseño reales. Para mi marca, esto importa. Para muchos casos de uso, no importa nada.
Lo que hay que entender antes de usarlo en producción
El modelo genera visualizaciones de alto impacto visual muy rápido. Pero no reemplaza a un diseñador si la identidad de marca es crítica. Es una herramienta de producción de contenido rápido, no de diseño de marca.
La imagen final: el guiño a Anthropic
Toda buena sesión de pruebas necesita un cierre con carácter.
Al final de la sesión quería cerrar con algo que resumiera el espíritu del experimento. No un resumen técnico. Algo con personalidad.
Le dije que quería una imagen horizontal para LinkedIn donde yo apareciera, con todas las visualizaciones que habíamos creado visibles en pantalla, y con un globo de diálogo dirigido a Anthropic. El mensaje: "Oye, ¿qué pasa, Anthropic? Mira lo que acabo de crear con mi nuevo modelo de imágenes. ¿Qué, chavalito?"
Me encantó. Tiene el tono exacto que buscaba: competitivo sin ser agresivo, con humor, con todas las imágenes del experimento visibles, y con el mensaje de fondo que es el verdadero tema de este artículo.
No va de si ChatGPT es mejor que Claude o viceversa. Va de lo que eres capaz de construir con las herramientas que tienes.
Conclusión: no va de modelos
La pregunta que importa no es cuál es el mejor modelo.
Todo el mundo habla del mejor modelo.
El mejor modelo de imágenes. El mejor modelo de texto. El mejor modelo de voz. Comparativas, benchmarks, rankings.
Eso es el ruido.
Lo que separa a quien saca resultado real de quien no lo saca no es qué modelo usa. Es si tiene algo real que procesar y si sabe cómo hablarle.
Yo entré en esta sesión con un artículo denso, con arquitectura conceptual real, con una tesis clara y con ganas de jugar. Eso es lo que hizo que salieran 8 formatos distintos con coherencia y calidad.
Si hubiera entrado con "hazme una infografía sobre IA en las empresas", el resultado habría sido genérico, vacío y olvidable.
El modelo de imágenes de ChatGPT es bueno. Muy bueno para lo que hace. Tiene límites reales que ya he descrito. Pero los límites que más importan no son los del modelo.
Son los de quien lo usa.
Mientras unos comparan modelos, otros ya estamos construyendo con ellos.