La génération de contenu par IA se diversifie
Springboards a annoncé le 1er juillet 2026 avoir développé Flint, un modèle conçu pour rendre la génération de contenu par IA moins répétitive sur les prompts ouverts. Cela compte parce que de nombreux workflows d'équipe en matière de naming, d'idéation de campagnes et de développement de concepts ne butent pas sur l'exactitude; ils butent sur l'uniformité. Selon le reportage du MIT Technology Review sur Flint, la startup tente de pousser les LLM au-delà des réponses habituelles à haute probabilité.
Springboards affirme que les LLM restent bloqués sur les mêmes réponses
L'accroche de la démo est simple et un peu injuste, comme le sont souvent les bonnes démos. Demandez à ChatGPT, Claude ou Gemini un nombre aléatoire entre 1 et 10, et vous obtenez souvent 7. Demandez un slogan pour New Balance, et Claude et ChatGPT auraient tous deux renvoyé la même phrase: Run your way.
C'est le principal grief que Springboards formule. Pour les tâches où la cohérence est utile, converger vers une réponse familière n'est pas un problème. Pour le brainstorming, c'est une taxe sur le processus. Lors d'un atelier client que j'ai animé plus tôt cette année, trois modèles grand public ont produit 18 options de slogan pour le lancement d'un logiciel B2B. Douze étaient une variante de plus rapide, plus intelligent, plus simple. L'équipe n'a pas été impressionnée, et honnêtement elle avait raison.
Le cofondateur de Springboards, Pip Bingemann, a déclaré au MIT Technology Review que « la plupart des modèles de langage luttent contre les hallucinations. Nous, nous les accueillons. » La citation est provocante, mais le point pratique est plus restreint. Il ne plaide pas pour le non-sens. Il soutient que le centre sûr de la courbe de probabilité est surutilisé dans les tâches créatives.
Pourquoi les prompts ouverts exposent le groupthink des modèles
Le contexte plus large est que ce n'est plus seulement une plainte de fondateur. L'article Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) a attiré l'attention en montrant que de nombreux modèles convergent vers des sorties très similaires pour les questions ouvertes, et le MIT Technology Review note que ce travail a ensuite remporté un prix du meilleur article à NeurIPS 2025.
Les exemples sont faciles à reconnaître une fois qu'on les cherche. Demandez une métaphore sur le temps et vous obtenez rivière ou tisserand. Demandez un nom de groupe et vous commencez à voir glass, neon, velvet ou static. Demandez une voiture et vous avez tendance à obtenir Toyota ou Honda. Demandez des idées de voyage en Europe et la même courte liste revient sans cesse.
Du point de vue opérationnel, cela se produit généralement à deux endroits. Premièrement, les équipes utilisent un seul modèle approuvé pour chaque tâche, du résumé de notes de réunion au naming d'une gamme de produits. Deuxièmement, elles évaluent les résultats un par un au lieu de les considérer comme un ensemble. Si vous ne voyez qu'une seule réponse, elle peut sembler assez fraîche. Si vous comparez 30 réponses sur trois modèles, vous remarquez à quelle vitesse elles s'effondrent dans la même voie.
Cela correspond également à ce que OpenAI dit du comportement des modèles, à savoir que les systèmes entraînés pour des sorties fiables et cohérentes se stabilisent souvent sur des réponses familières à haute probabilité. C'est un compromis, pas un rapport de bug.
Ce que les marketeurs et créatifs tirent d'un éventail d'idées plus large
Le public immédiat de Flint est les équipes publicitaires et marketing, ce qui a du sens. Ces équipes perdent du temps sur la génération de premières versions: pistes de naming, lignes de campagne, angles de positionnement produit, accroches, jeux de titres et territoires créatifs. Si chaque modèle vous donne la même réponse au centre de masse, l'IA accélère la production tout en rétrécissant l'exploration.
Le MIT Technology Review cite la stratège Zoe Scaman disant que Flint lui a été utile pour la projeter dans « des directions complètement différentes. » C'est une bonne description de l'endroit où un modèle à haute variance a sa place. Pas dans la copie finale. Pas dans la vérification des allégations. Pas dans la messagerie sensible au niveau juridique. Dans la phase précoire chaotique où l'équipe tente d'élargir l'éventail d'options avant que le jugement ne commence.
J'ai observé le même schéma avec les outils marketing d'IA dans la pratique. Le meilleur workflow n'est généralement pas choisir un modèle et lui faire confiance. C'est: générer avec un modèle familier, générer à nouveau avec un modèle à plus forte variance, puis obliger les humains à indiquer quelles options sont réellement distinctes. Si deux sorties semblent différentes mais mènent au même angle de campagne, ce sont des doublons portant des vestes différentes.
Pour les équipes qui souhaitent formaliser ce processus, l'adéquation interne la plus proche est AI Content Generation Solutions, car le vrai problème ici n'est pas seulement le choix du modèle, mais la manière dont l'IA pour le marketing s'intègre dans un workflow de contenu reproductible.
Comment Flint ajoute de la variété sans tout transformer en bruit
Le détail technique intéressant est que Springboards n'a pas simplement monté la température et considéré que c'était réglé. Selon le reportage, Flint a été construit sur Qwen 3 d'Alibaba et entraîné pour ajouter plus d'aléatoire uniquement aux points où une réponse a plusieurs branches plausibles.
Cette distinction compte. J'ai testé des paramètres de haute température dans des bacs à sable de production, et le mode de défaillance est évident: toute la phrase devient instable. Le modèle ne choisit pas simplement un nom moins commun; il commence à vaciller sur la structure, le ton et l'ancrage factuel. L'exemple de Browne dans le reportage est sans détour: monter la température trop haut a fait passer un modèle OpenAI de l'anglais au code au milieu d'une phrase.
L'aléatoire ciblé est une idée plus utilisable. Si le prompt est Où devrais-je aller en Europe?, vous voulez surtout de la variété au niveau du choix de destination, pas dans le tissu conjonctif qui l'entoure. En d'autres termes, plus d'entropie au point de branchement, un comportement normal partout ailleurs.
C'est là que les intégrations d'IA personnalisées deviennent pertinentes pour les équipes au-delà des agences publicitaires. Vous n'avez pas besoin d'un modèle entièrement nouveau pour tirer la leçon. Vous pouvez router les prompts d'idéation vers une stack, les prompts de recherche vers une autre, et les brouillons prêts pour approbation vers une troisième. L'astuce consiste à concevoir la logique de transfert au lieu de prétendre qu'un seul modèle devrait être également bon pour les trois tâches.
Ce que cela signifie pour les équipes choisissant des modèles de brainstorming
Si cette nouvelle se confirme, la conclusion n'est pas que les LLM grand public sont mauvais pour la génération de contenu par IA. C'est que de nombreuses équipes les ont utilisés avec la mauvaise métrique de succès. Pour le codage, la synthèse et la rédaction stable, les réponses moyennes sont souvent exactement ce que vous voulez. Pour le brainstorming, les réponses moyennes sont là où le travail original s'aplatit.
Je ne lirais donc pas Flint comme une histoire de remplacement. Je la lirais comme une histoire de routage:
- utiliser les modèles grand public pour la cohérence, le cadrage de recherche et les brouillons structurés
- utiliser les modèles à forte variété pour le naming, les accroches, les métaphores et la divergence conceptuelle
- comparer les résultats côte à côte avant que quiconque commence à éditer
- garder les humains responsables du goût, de l'adéquation à la marque et des allégations factuelles
Ce workflow réduit également une défaillance courante que je constate avec les services d'intégration d'IA: les équipes automatisent trop tôt. Elles branch un modèle dans un pipeline de contenu, puis se rendent compte plus tard que chaque campagne sonne désormais statistiquement familière. La diversité est plus facile à tester avant que la couche d'automatisation ne se rigidifie autour de la première configuration.
La conclusion pour les programmes d'adoption de l'IA
L'histoire de Springboards est utile parce qu'elle reformule une contrainte cachée. Beaucoup d'équipes pensent que leur prompting est faible alors que le vrai problème est que la famille de modèles converge vers les mêmes sorties sûres. De meilleurs prompts aident, mais ils ne résolvent pas entièrement l'homogénéité des modèles.
Ce qu'il faut surveiller ensuite est si les grands éditeurs exposent des contrôles plus précis pour une nouveauté contrôlée au lieu d'une aléatoire brute. Surveillez également si les équipes marketing et média commencent à noter les sorties de modèles sur la distinctivité, pas seulement sur la vitesse et la cohérence. Ce serait un benchmark plus honnête pour le travail créatif avec l'IA en 2026.
Rédigé par l'équipe Encorp. Parlons-en: réservez un appel de 30 min ou suivez-nous sur LinkedIn.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation