La generación de contenido con IA se vuelve más variada
Springboards anunció el 1 de julio de 2026 que ha desarrollado Flint, un modelo ajustado para hacer que la generación de contenido con IA sea menos repetitiva en prompts abiertos. Esto es relevante porque muchos flujos de trabajo de equipos en naming, ideación de campañas y desarrollo de conceptos no fallan por falta de precisión; fallan por homogeneidad. Según el reporte de MIT Technology Review sobre Flint, la startup intenta sacar a los LLM de las respuestas de alta probabilidad habituales.
Springboards dice que los LLM están atrapados en las mismas respuestas
El gancho de la demo es simple y un poco injusto, como suelen ser las buenas demos. Pídele a ChatGPT, Claude o Gemini un número aleatorio entre 1 y 10, y a menudo te dan 7. Pídeles un eslogan para New Balance, y tanto Claude como ChatGPT reportadamente devolvieron la misma frase: Run your way.
Esa es la queja central de Springboards. Para tareas donde la consistencia es útil, converger en una respuesta familiar está bien. Para la lluvia de ideas, es un impuesto al proceso. En un taller con cliente que dirigí a principios de este año, tres modelos convencionales produjeron 18 opciones de eslogan para el lanzamiento de un software B2B. Doce eran alguna variante de más rápido, más inteligente, más simple. El equipo no quedó impresionado, y sinceramente tenían razón.
El cofundador de Springboards, Pip Bingemann, dijo a MIT Technology Review que "la mayoría de los modelos de lenguaje luchan contra las alucinaciones. Nosotros las damos la bienvenida". La cita es provocadora, pero el punto práctico es más estrecho. No aboga por el sinsentido. Argumenta que el centro seguro de la curva de probabilidad está sobreutilizado en tareas creativas.
Por qué los prompts abiertos exponen el pensamiento grupal de los modelos
El contexto más amplio es que esto ya no es solo una queja de fundador. El paper Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) llamó la atención por demostrar que muchos modelos convergen en resultados muy similares para preguntas abiertas, y MIT Technology Review señala que el trabajo posteriormente ganó un premio al mejor paper en NeurIPS 2025.
Los ejemplos son fáciles de reconocer una vez que sabes buscarlos. Pide una metáfora sobre el tiempo y te dan río o tejedor. Pide un nombre de banda y empiezas a ver cristal, neón, terciopelo o estática. Pide un coche y tiendes a obtener Toyota o Honda. Pide ideas para viajar por Europa y aparece la misma lista corta una y otra vez.
Desde la perspectiva operativa, esto suele ocurrir en dos escenarios. Primero, los equipos usan un único modelo aprobado para todo, desde resumir notas de reuniones hasta nombrar una línea de productos. Segundo, evalúan los resultados uno por uno en lugar de como conjunto. Si solo ves una respuesta, puede sonar lo suficientemente fresca. Si comparas 30 respuestas de tres modelos, notas con qué rapidez colapsan en el mismo carril.
Esto también es consistente con lo que OpenAI dice sobre el comportamiento de los modelos, a saber, que los sistemas entrenados para ofrecer resultados fiables y coherentes a menudo se asientan en respuestas familiares de alta probabilidad. Eso es una compensación, no un reporte de error.
Qué obtienen los marketers y creativos de un conjunto de ideas más amplio
La audiencia inmediata de Flint son los equipos de publicidad y marketing, lo cual tiene sentido. Esos equipos invierten tiempo en la generación de primeros borradores: rutas de naming, líneas de campaña, ángulos de posicionamiento de producto, ganchos, sets de titulares y territorios creativos. Si cada modelo te da la misma respuesta de centro de masa, la IA acelera la producción mientras reduce la exploración.
MIT Technology Review cita a la estratega Zoe Scaman diciendo que Flint le sirvió para lanzarla en "direcciones completamente diferentes". Esa es una buena descripción de dónde encaja un modelo de alta varianza. No en el copy final. No en la revisión de claims. No en mensajería sensible legalmente. En la etapa temprana y caótica donde el equipo intenta ampliar el conjunto de opciones antes de que empiece el juicio.
He visto el mismo patrón con herramientas de marketing con IA en la práctica. El mejor flujo de trabajo no suele ser "elige un modelo y confía en él". Es: genera con un modelo familiar, genera de nuevo con un modelo de mayor varianza, y luego obliga a los humanos a marcar qué opciones son realmente distintas. Si dos resultados parecen diferentes pero llevan al mismo ángulo de campaña, son duplicados con chaquetas distintas.
Para los equipos que quieren formalizar ese proceso, el ajuste interno más cercano son las Soluciones de Generación de Contenido con IA, porque el problema real aquí no es solo la elección del modelo, sino cómo se integra la IA para marketing en un flujo de contenido repetible.
Cómo añade Flint variedad sin convertir todo en ruido
El detalle técnico interesante es que Springboards no simplemente subió la temperatura y listo. Según el reporte, Flint se construyó sobre Qwen 3 de Alibaba y se entrenó para añadir más aleatoriedad solo en los puntos donde una respuesta tiene múltiples ramas plausibles.
Esa distinción importa. He probado configuraciones de alta temperatura en entornos de prueba de producción, y el modo de fallo es obvio: toda la oración se vuelve inestable. El modelo no solo elige un sustantivo menos común; empieza a tambalearse en estructura, tono y fundamento factual. El ejemplo de Browne en el reporte es contundente: subir demasiado la temperatura hizo que un modelo de OpenAI cambiara del inglés al código a mitad de una oración.
La aleatoriedad dirigida es una idea más usable. Si el prompt es "¿A dónde debería ir en Europa?", quieres variedad principalmente en la elección del destino, no en el tejido conectivo que lo rodea. En otras palabras, más entropía en el punto de ramificación, comportamiento normal en todo lo demás.
Ahí es donde las integraciones de IA personalizadas se vuelven relevantes para equipos más allá de las agencias de publicidad. No necesitas un modelo nuevo para aplicar la lección. Puedes enrutar prompts de ideación a una pila, prompts de investigación a otra, y borradores listos para aprobación a una tercera. El truco está en diseñar la lógica de transferencia en lugar de pretender que un modelo debería ser igual de bueno en los tres trabajos.
Qué significa esto para los equipos que eligen modelos para la lluvia de ideas
Si esta noticia se confirma, la conclusión no es que los LLM convencionales sean malos en generación de contenido con IA. Es que muchos equipos los han estado usando con la métrica de éxito equivocada. Para programación, síntesis y redacción estable, las respuestas promedio suelen ser exactamente lo que se necesita. Para la lluvia de ideas, las respuestas promedio son donde el trabajo original se aplana.
Así que no leería Flint como una historia de reemplazo. La leería como una historia de enrutamiento:
- usa modelos convencionales para consistencia, enmarcado de investigación y borradores estructurados
- usa modelos de alta variedad para naming, ganchos, metáforas y divergencia de conceptos
- compara los resultados lado a lado antes de que alguien empiece a editar
- mantén a los humanos responsables del gusto, ajuste de marca y claims factuales
Ese flujo de trabajo también reduce un fallo común que sigo viendo con los servicios de integración de IA: los equipos automatizan demasiado pronto. Conectan un modelo a una pipeline de contenido, y solo después se dan cuenta de que cada campaña ahora suena estadísticamente familiar. La diversidad es más fácil de probar antes de que la capa de automatización se endurezca alrededor de la primera configuración.
La conclusión para los programas de adopción de IA
La historia de Springboards es útil porque redefine una restricción oculta. Muchos equipos piensan que su prompting es débil cuando el problema real es que la familia de modelos converge en los mismos resultados seguros. Mejores prompts ayudan, pero no resuelven completamente la homogeneidad de modelos.
Lo que hay que observar ahora es si los proveedores más grandes exponen controles más precisos para novedad controlada en lugar de aleatoriedad bruta. También observar si los equipos de marketing y medios empiezan a puntuar los resultados de los modelos por distintividad, no solo por velocidad y coherencia. Ese sería un benchmark más honesto para el trabajo creativo con IA en 2026.
Escrito por el equipo de Encorp. Habla con nosotros: reserva una llamada de 30 minutos o síguenos en LinkedIn.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation