KI-gestützte Content-Generierung wird vielfältiger
Springboards gab am 1. Juli 2026 bekannt, dass es Flint entwickelt hat – ein Modell, das darauf abgestimmt ist, KI-gestützte Content-Generierung bei offenen Prompts weniger repetitiv zu gestalten. Das ist relevant, weil viele Team-Workflows in der Namensfindung, Kampagnenideation und Konzeptentwicklung nicht an mangelnder Genauigkeit scheitern, sondern an Eintönigkeit. Laut MIT Technology Reviews Bericht über Flint versucht das Startup, LLMs über die üblichen wahrscheinlichkeitsstarken Antworten hinauszutreiben.
Springboards: LLMs bleiben bei denselben Antworten hängen
Die Demo ist simpel und ein bisschen unfair, wie gute Demos eben so sind. Fragt man ChatGPT, Claude oder Gemini nach einer Zufallszahl zwischen 1 und 10, kommt oft 7. Fragt man nach einem Claim für New Balance, sollen Claude und ChatGPT angeblich dieselbe Zeile geliefert haben: Run your way.
Das ist die Kernkritik von Springboards. Bei Aufgaben, bei denen Konsistenz nützlich ist, ist die Konvergenz auf eine bekannte Antwort in Ordnung. Beim Brainstorming ist das eine Steuer auf den Prozess. In einem Kunden-Workshop, den ich früher dieses Jahr leitete, produzierten drei gängige Modelle 18 Slogan-Optionen für einen B2B-Software-Launch. Zwölf waren irgendeine Variante von schneller, smarter, einfacher. Das Team war nicht beeindruckt – und ehrlich gesagt hatten sie recht.
Springboards-Mitgründer Pip Bingemann sagte gegenüber MIT Technology Review: „Die meisten Sprachmodelle bekämpfen Halluzinationen. Wir begrüßen sie.“ Das Zitat ist provokant, aber der praktische Punkt ist enger gefasst. Er plädiert nicht für Unsinn. Er argumentiert, dass die sichere Mitte der Wahrscheinlichkeitskurve bei kreativen Aufgaben überstrapaziert wird.
Warum offene Prompts den Gruppendenken-Effekt von Modellen aufdecken
Der breitere Kontext ist, dass dies längst nicht mehr nur eine Gründer-Beschwerde ist. Das Paper Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) erregte Aufmerksamkeit, weil es zeigt, dass viele Modelle bei offenen Fragen auf sehr ähnliche Outputs konvergieren, und MIT Technology Review merkt an, dass die Arbeit später einen Best-Paper-Award bei NeurIPS 2025 gewann.
Die Beispiele erkennt man leicht, sobald man danach sucht. Fragt man nach einer Metapher für Zeit, kommt Fluss oder Weber. Fragt man nach einem Bandnamen, tauchen Glas, Neon, Samt oder Statik auf. Fragt man nach einem Auto, tendiert es zu Toyota oder Honda. Fragt man nach Reiseideen für Europa, erscheint dieselbe Kurzliste immer wieder.
Aus Betreibersicht passiert das meist an zwei Stellen. Erstens nutzen Teams ein einziges genehmigtes Modell für jeden Job – von der Zusammenfassung von Besprechungsnotizen bis zur Produktlinien-Namensfindung. Zweitens bewerten sie Outputs einzeln statt als Set. Wenn man nur eine Antwort sieht, kann sie frisch genug klingen. Vergleicht man 30 Antworten über drei Modelle, fällt auf, wie schnell sie in dieselbe Spur einbiegen.
Das deckt sich auch mit dem, was OpenAI zum Modellverhalten sagt, nämlich dass Systeme, die auf zuverlässige, kohärente Outputs trainiert werden, oft bei vertrauten, wahrscheinlichkeitsstarken Antworten landen. Das ist ein Kompromiss, kein Bugreport.
Was Marketer und Kreative von einem breiteren Ideenset gewinnen
Die primäre Zielgruppe für Flint sind Werbe- und Marketingteams – das macht Sinn. Diese Teams verbrauchen Zeit mit der Erstentwurf-Generierung: Namensrouten, Kampagnenzeilen, Produktpositionierungswinkel, Hooks, Headline-Sets und kreative Territorien. Wenn jedes Modell dieselbe mittige Antwort liefert, beschleunigt die KI die Produktion, während sie die Exploration einengt.
MIT Technology Review zitiert Strategin Zoe Scaman, die sagt, Flint habe sie in „völlig andere Richtungen“ geworfen. Das ist eine gute Beschreibung dafür, wo ein Modell mit hoher Varianz hingehört. Nicht in den Finalcopy. Nicht in die Claims-Prüfung. Nicht in rechtsrelevante Messaging. In die unübersichtliche frühe Phase, in der das Team versucht, den Optionensatz zu erweitern, bevor die Bewertung beginnt.
Ich habe dasselbe Muster bei KI-Marketingtools in der Praxis gesehen. Der beste Workflow ist meist nicht: Ein Modell wählen und ihm vertrauen. Sondern: Mit einem vertrauten Modell generieren, mit einem höher-varianz Modell nochmals generieren, dann die Menschen zwingen, zu markieren, welche Optionen tatsächlich unterschiedlich sind. Wenn zwei Outputs sich anders anfühlen, aber zum gleichen Kampagnenwinkel führen, sind das Duplikate in anderen Jacken.
Für Teams, die diesen Prozess formalisieren wollen, passt intern am ehesten AI Content Generation Solutions, denn das eigentliche Problem ist nicht nur die Modellwahl, sondern wie KI für Marketing in einen wiederholbaren Content-Workflow integriert wird.
Wie Flint Vielfalt schafft, ohne alles in Rauschen zu verwandeln
Das interessante technische Detail ist, dass Springboards nicht einfach die Temperatur hochgedreht und es dabei belassen hat. Laut Bericht wurde Flint auf Qwen 3 von Alibaba aufgebaut und so trainiert, dass mehr Zufälligkeit nur an den Punkten hinzugefügt wird, an denen eine Antwort mehrere plausible Verzweigungen hat.
Diese Unterscheidung ist wichtig. Ich habe hohe Temperatur-Einstellungen in Produktions-Sandboxes getestet, und der Fehlermodus ist offensichtlich: Der ganze Satz wird instabil. Das Modell wählt nicht nur ein selteneres Nomen; es beginnt zu wackeln in Struktur, Ton und faktischer Grundlage. Browns Beispiel im Bericht ist unverblümt: Zu hohe Temperatur ließ ein OpenAI-Modell mitten im Satz von Englisch in Code wechseln.
Gezielte Zufälligkeit ist eine brauchbarere Idee. Lautet der Prompt „Wohin sollte ich in Europa reisen?“, will man vor allem Vielfalt bei der Zielauswahl, nicht im Bindegewebe drumherum. Mit anderen Worten: mehr Entropie am Verzweigungspunkt, normales Verhalten überall sonst.
Das ist der Punkt, an dem maßgeschneiderte KI-Integrationen auch für Teams jenseits von Werbeagenturen relevant werden. Man braucht kein völlig neues Modell, um die Lehre anzuwenden. Man kann Ideations-Prompts an einen Stack leiten, Recherche-Prompts an einen zweiten und genehmigungsfertige Entwürfe an einen dritten. Der Trick ist, die Übergabe-Logik zu designen, statt so zu tun, als sei ein Modell für alle drei Jobs gleich gut geeignet.
Was das für Teams bedeutet, die Modelle fürs Brainstorming wählen
Wenn sich diese Nachricht bewahrheitet, ist die Lehre nicht, dass gängige LLMs schlecht in der KI-Content-Generierung sind. Sondern, dass viele Teams sie mit der falschen Erfolgsmetrik eingesetzt haben. Für Coding, Synthese und stabile Entwürfe sind durchschnittliche Antworten oft genau das, was man will. Für Brainstorming sind durchschnittliche Antworten der Ort, an dem originelle Arbeit verflacht.
Ich würde Flint also nicht als Ersatzgeschichte lesen. Sondern als Routing-Geschichte:
- Gängige Modelle für Konsistenz, Recherche-Framing und strukturierte Entwürfe nutzen
- Hochvarianz-Modelle für Namensfindung, Hooks, Metaphern und Konzept-Divergenz nutzen
- Outputs vor dem Editieren nebeneinander vergleichen
- Menschen für Geschmack, Brand-Fit und Faktenprüfung verantwortlich lassen
Dieser Workflow reduziert auch einen häufigen Fehler, den ich bei KI-Integrations-Services immer wieder sehe: Teams automatisieren zu früh. Sie stecken ein Modell in eine Content-Pipeline und merken erst später, dass jede Kampagne nun statistisch vertraut klingt. Vielfalt lässt sich leichter testen, bevor die Automatisierungsschicht um die erste Einrichtung herum erhärtet.
Die Lehre für KI-Adoptionsprogramme
Die Springboards-Geschichte ist nützlich, weil sie eine versteckte Einschränkung neu rahmt. Viele Teams glauben, ihr Prompting sei schwach, wenn das eigentliche Problem ist, dass die Modellfamilie auf dieselben sicheren Outputs konvergiert. Bessere Prompts helfen, lösen aber die Modell-Homogenität nicht vollständig.
Was als Nächstes zu beobachten ist: Ob größere Anbieter präzisere Kontrollen für kontrollierte Neuheit anbieten, statt blinder Zufälligkeit. Und ob Marketing- und Medienteams damit beginnen, Modell-Outputs nach Unterscheidungskraft zu bewerten, nicht nur nach Geschwindigkeit und Kohärenz. Das wäre ein ehrlicherer Benchmark für kreative KI-Arbeit im Jahr 2026.
Verfasst vom Encorp-Team. Sprechen Sie mit uns: 30-Minuten-Termin vereinbaren oder folgen Sie uns auf LinkedIn.
Schlagwörter
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation