La generazione di contenuti AI diventa più variegata
Springboards ha annunciato il 1° luglio 2026 di aver creato Flint, un modello ottimizzato per rendere la generazione di contenuti AI meno ripetitiva con prompt a risposta aperta. Questo è importante perché molti flussi di lavoro dei team, come la scelta dei nomi, l'ideazione di campagne e lo sviluppo di concept, non falliscono per mancanza di precisione, ma per eccessiva uniformità. Secondo il report del MIT Technology Review su Flint, la startup sta cercando di spingere gli LLM oltre le solite risposte ad alta probabilità.
Springboards afferma che gli LLM sono bloccati sulle stesse risposte
Il gancio della demo è semplice e un po' ingiusto, come spesso accade con le buone demo. Chiedi a ChatGPT, Claude o Gemini un numero casuale tra 1 e 10 e spesso otterrai 7. Chiedi uno slogan per New Balance e sia Claude che ChatGPT hanno riportato la stessa frase: Run your way.
Questa è la critica principale mossa da Springboards. Per i compiti in cui la coerenza è utile, convergere su una risposta familiare va bene. Per il brainstorming, è un freno al processo. In un workshop con un cliente che ho condotto all'inizio di quest'anno, tre modelli mainstream hanno prodotto 18 opzioni di slogan per il lancio di un software B2B. Dodici erano versioni di "più veloce, più intelligente, più semplice". Il team non è rimasto colpito e, onestamente, avevano ragione.
Il co-fondatore di Springboards, Pip Bingemann, ha dichiarato al MIT Technology Review che “la maggior parte dei modelli linguistici combatte le allucinazioni. Noi le accogliamo”. La citazione è provocatoria, ma il punto pratico è più limitato. Non sta sostenendo l'uso di sciocchezze, ma che la zona sicura della curva di probabilità viene abusata nei compiti creativi.
Perché i prompt a risposta aperta espongono il pensiero di gruppo dei modelli
Il contesto più ampio è che questa non è più solo una lamentela dei fondatori. Il documento Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) ha attirato l'attenzione per aver dimostrato che molti modelli convergono su output molto simili per domande a risposta aperta, e il MIT Technology Review nota che il lavoro ha poi vinto un premio come miglior articolo al NeurIPS 2025.
Gli esempi sono facili da riconoscere una volta che si sa cosa cercare. Chiedi una metafora sul tempo e otterrai un fiume o un tessitore. Chiedi un nome per una band e inizierai a vedere vetro, neon, velluto o statico. Chiedi un'auto e tenderai a ottenere Toyota o Honda. Chiedi idee per viaggi in Europa e continua ad apparire la stessa lista ristretta.
Dal punto di vista operativo, questo accade solitamente in due casi. Primo, i team usano un unico modello approvato per ogni lavoro, dal riassunto delle note di riunione alla denominazione di una linea di prodotti. Secondo, valutano gli output uno per uno invece che come un insieme. Se vedi solo una risposta, può sembrare abbastanza fresca. Se confronti 30 risposte su tre modelli, noti quanto velocemente collassano nella stessa direzione.
Questo è anche coerente con ciò che OpenAI afferma sul comportamento dei modelli, ovvero che i sistemi addestrati per un output affidabile e coerente spesso si stabilizzano su risposte familiari ad alta probabilità. È un compromesso, non un bug.
Cosa ottengono marketer e creativi da un set di idee più ampio
Il pubblico immediato di Flint sono i team di pubblicità e marketing, il che ha senso. Questi team perdono tempo nella generazione delle prime bozze: percorsi di naming, linee di campagna, angolazioni di posizionamento del prodotto, ganci, set di titoli e territori creativi. Se ogni modello ti dà la stessa risposta standard, l'AI accelera la produzione restringendo però l'esplorazione.
Il MIT Technology Review cita la stratega Zoe Scaman, la quale afferma che Flint è stato utile per spingerla in “direzioni completamente diverse”. Questa è un'ottima descrizione di dove appartiene un modello ad alta varianza. Non nella copia finale. Non nella revisione delle dichiarazioni. Non nei messaggi sensibili dal punto di vista legale. Ma nella fase iniziale e disordinata in cui il team sta cercando di ampliare il set di opzioni prima che inizi il giudizio.
Ho visto lo stesso schema con gli strumenti di marketing AI nella pratica. Il miglior flusso di lavoro solitamente non è scegliere un modello e fidarsi. È generare con un modello familiare, generare di nuovo con un modello a varianza più elevata, quindi costringere gli esseri umani a contrassegnare quali opzioni sono effettivamente distinte. Se due output sembrano diversi ma portano alla stessa angolazione della campagna, sono duplicati con giacche diverse.
Per i team che vogliono formalizzare questo processo, la soluzione interna più adatta sono le Soluzioni di Generazione di Contenuti AI, perché il vero problema qui non è solo la scelta del modello, ma come l'AI per il marketing viene integrata in un flusso di lavoro di contenuti ripetibile.
Come Flint aggiunge varietà senza trasformare tutto in rumore
Il dettaglio tecnico interessante è che Springboards non si è limitata ad alzare la temperatura e chiudere la questione. Secondo il report, Flint è stato costruito su Qwen 3 di Alibaba e addestrato ad aggiungere più casualità solo nei punti in cui una risposta ha molteplici rami plausibili.
Questa distinzione è importante. Ho testato impostazioni ad alta temperatura in sandbox di produzione e la modalità di fallimento è ovvia: l'intera frase diventa instabile. Il modello non sceglie semplicemente un sostantivo meno comune; inizia a vacillare su struttura, tono e fondamento fattuale. L'esempio di Browne nel report è diretto: alzare troppo la temperatura ha fatto passare un modello OpenAI dall'inglese al codice a metà frase.
La casualità mirata è un'idea più utilizzabile. Se il prompt è "Dove dovrei andare in Europa?", vuoi principalmente varietà nella scelta della destinazione, non nel tessuto connettivo circostante. In altre parole, più entropia nel punto di ramificazione, comportamento normale ovunque altro.
È qui che le integrazioni AI personalizzate diventano rilevanti per i team oltre alle agenzie pubblicitarie. Non hai bisogno di un modello nuovo di zecca per imparare la lezione. Puoi instradare i prompt di ideazione su uno stack, i prompt di ricerca su un altro e le bozze pronte per l'approvazione su un terzo. Il trucco è progettare la logica di passaggio invece di fingere che un modello debba essere ugualmente bravo in tutti e tre i lavori.
Cosa significa questo per i team che scelgono modelli per il brainstorming
Se questa notizia viene confermata, la conclusione non è che gli LLM mainstream siano pessimi nella generazione di contenuti AI. È che molti team li hanno usati con la metrica di successo sbagliata. Per la codifica, la sintesi e la stesura stabile, le risposte medie sono spesso esattamente ciò che desideri. Per il brainstorming, le risposte medie sono dove il lavoro originale si appiattisce.
Quindi non leggerei Flint come una storia di sostituzione. La leggerei come una storia di instradamento:
- usa modelli mainstream per coerenza, inquadramento della ricerca e bozze strutturate
- usa modelli ad alta varietà per naming, ganci, metafore e divergenza di concept
- confronta gli output fianco a fianco prima che qualcuno inizi a modificare
- mantieni gli esseri umani responsabili del gusto, dell'adattamento al brand e delle affermazioni fattuali
Questo flusso di lavoro riduce anche un fallimento comune che continuo a vedere con i servizi di integrazione AI: i team automatizzano troppo presto. Collegano un modello a una pipeline di contenuti, per poi rendersi conto solo in seguito che ogni campagna suona statisticamente familiare. La diversità è più facile da testare prima che lo strato di automazione si indurisca attorno alla prima configurazione.
Il punto chiave per i programmi di adozione dell'AI
La storia di Springboards è utile perché riformula un vincolo nascosto. Molti team pensano che il loro prompting sia debole quando il vero problema è che la famiglia di modelli sta convergendo sugli stessi output sicuri. Prompt migliori aiutano, ma non risolvono completamente l'omogeneità del modello.
Ciò che resta da osservare è se i grandi vendor esporranno controlli più precisi per una novità controllata invece di una casualità grossolana. Osservate anche se i team di marketing e media inizieranno a valutare gli output dei modelli in base alla distintività, non solo alla velocità e alla coerenza. Sarebbe un benchmark più onesto per il lavoro creativo AI nel 2026.
Scritto dal team di Encorp. Parla con noi: prenota una chiamata di 30 minuti o seguici su LinkedIn.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation