Generowanie treści przez AI staje się bardziej różnorodne
Firma Springboards ogłosiła 1 lipca 2026 r., że stworzyła Flint, model dostrojony tak, aby generowanie treści przez AI było mniej powtarzalne w przypadku otwartych promptów. Ma to znaczenie, ponieważ wiele procesów zespołowych w zakresie nazewnictwa, tworzenia kampanii i rozwoju koncepcji nie zawodzi pod względem dokładności, lecz pod względem monotonii. Według raportu MIT Technology Review na temat Flint, startup ten stara się wypchnąć LLM-y poza typowe odpowiedzi o wysokim prawdopodobieństwie.
Springboards twierdzi, że LLM-y utknęły w martwym punkcie tych samych odpowiedzi
Haczyk demonstracyjny jest prosty i nieco nieuczciwy, jak to zwykle bywa w dobrych prezentacjach. Poproś ChatGPT, Claude lub Gemini o losową liczbę od 1 do 10, a często otrzymasz 7. Poproś o hasło reklamowe dla New Balance, a zarówno Claude, jak i ChatGPT podobno zwróciły to samo: Run your way.
To główny zarzut, jaki stawia Springboards. W zadaniach, gdzie spójność jest użyteczna, zbieżność do znanej odpowiedzi jest w porządku. W przypadku burzy mózgów jest to jednak obciążenie dla procesu. Podczas warsztatów z klientem, które prowadziłem na początku tego roku, trzy główne modele wygenerowały 18 opcji haseł dla premiery oprogramowania B2B. Dwanaście z nich było wariacjami słów: szybciej, mądrzej, prościej. Zespół nie był pod wrażeniem i szczerze mówiąc, mieli rację.
Współzałożyciel Springboards, Pip Bingemann, powiedział MIT Technology Review, że „większość modeli językowych walczy z halucynacjami. My je witamy”. Ten cytat jest prowokacyjny, ale praktyczny wniosek jest węższy. Nie opowiada się za nonsensem. Argumentuje, że bezpieczny środek krzywej prawdopodobieństwa jest nadużywany w zadaniach kreatywnych.
Dlaczego otwarte prompty obnażają myślenie grupowe modeli
Szerszy kontekst jest taki, że nie jest to już tylko narzekanie założyciela. Publikacja Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) zwróciła uwagę na to, że wiele modeli zbiega się do bardzo podobnych wyników w przypadku pytań otwartych, a MIT Technology Review zauważa, że praca ta zdobyła później nagrodę za najlepszy artykuł na NeurIPS 2025.
Przykłady łatwo rozpoznać, gdy się ich szuka. Poproś o metaforę czasu, a otrzymasz rzekę lub tkacza. Poproś o nazwę zespołu, a zaczniesz widzieć szkło, neon, aksamit lub statykę. Poproś o samochód, a zazwyczaj otrzymasz Toyotę lub Hondę. Poproś o pomysły na podróż po Europie, a wciąż pojawia się ta sama krótka lista.
Z perspektywy operatora dzieje się to zazwyczaj w dwóch miejscach. Po pierwsze, zespoły używają jednego zatwierdzonego modelu do każdej pracy, od podsumowywania notatek ze spotkań po nazywanie linii produktów. Po drugie, oceniają wyniki jeden po drugim, zamiast jako zestaw. Jeśli widzisz tylko jedną odpowiedź, może brzmieć wystarczająco świeżo. Jeśli porównasz 30 odpowiedzi w trzech modelach, zauważysz, jak szybko zbiegają się one do tego samego toru.
Jest to również zgodne z tym, co OpenAI mówi o zachowaniu modeli, a mianowicie, że systemy szkolone pod kątem niezawodnych, spójnych wyników często osiadają na znanych odpowiedziach o wysokim prawdopodobieństwie. To kompromis, a nie błąd.
Co marketerzy i kreatywni zyskują dzięki szerszemu zestawowi pomysłów
Bezpośrednimi odbiorcami Flint są zespoły reklamowe i marketingowe, co ma sens. Zespoły te tracą czas na generowanie pierwszych szkiców: tras nazewnictwa, linii kampanii, kątów pozycjonowania produktu, haczyków, zestawów nagłówków i terytoriów kreatywnych. Jeśli każdy model daje tę samą odpowiedź ze środka rozkładu, AI przyspiesza produkcję, jednocześnie zawężając eksplorację.
MIT Technology Review cytuje strateżkę Zoe Scaman, która twierdzi, że Flint był przydatny do kierowania jej w „całkowicie odmienne strony”. To dobry opis tego, gdzie pasuje model o dużej wariancji. Nie w ostatecznej kopii. Nie w przeglądzie roszczeń. Nie w komunikatach wrażliwych prawnie. W chaotycznym wczesnym etapie, kiedy zespół próbuje poszerzyć zestaw opcji, zanim zacznie się ocena.
Widziałem ten sam wzorzec w praktyce z narzędziami marketingowymi AI. Najlepszy przepływ pracy to zazwyczaj nie wybór jednego modelu i ufanie mu. To generowanie za pomocą znanego modelu, ponowne generowanie za pomocą modelu o wyższej wariancji, a następnie zmuszenie ludzi do oznaczenia, które opcje są faktycznie odrębne. Jeśli dwa wyniki wydają się inne, ale prowadzą do tego samego kąta kampanii, są duplikatami w różnych opakowaniach.
Dla zespołów, które chcą sformalizować ten proces, najbliższym dopasowaniem wewnętrznym są Rozwiązania w zakresie generowania treści AI, ponieważ prawdziwym problemem nie jest tylko wybór modelu, ale to, jak AI w marketingu jest integrowane z powtarzalnym przepływem pracy nad treścią.
Jak Flint dodaje różnorodności, nie zamieniając wszystkiego w szum
Ciekawym szczegółem technicznym jest to, że Springboards nie tylko podkręciło temperaturę i na tym poprzestało. Według raportu, Flint został zbudowany na Qwen 3 od Alibaba i wytrenowany, aby dodawać więcej losowości tylko w punktach, w których odpowiedź ma wiele wiarygodnych gałęzi.
To rozróżnienie ma znaczenie. Testowałem ustawienia wysokiej temperatury w piaskownicach produkcyjnych i tryb awarii jest oczywisty: całe zdanie staje się niestabilne. Model nie tylko wybiera mniej powszechny rzeczownik; zaczyna chwiać się w strukturze, tonie i faktach. Przykład Browne'a w raporcie jest dosadny: zbyt wysokie podkręcenie temperatury spowodowało, że jeden z modeli OpenAI przeszedł z angielskiego na kod w połowie zdania.
Ukierunkowana losowość to bardziej użyteczny pomysł. Jeśli prompt brzmi: Gdzie powinienem pojechać w Europie?, głównie chcesz różnorodności w wyborze miejsca docelowego, a nie w tkance łącznej wokół niego. Innymi słowy, więcej entropii w punkcie rozgałęzienia, normalne zachowanie wszędzie indziej.
To właśnie tutaj niestandardowe integracje AI stają się istotne dla zespołów spoza agencji reklamowych. Nie potrzebujesz zupełnie nowego modelu, aby wyciągnąć lekcję. Możesz kierować prompty ideacyjne do jednego stosu, prompty badawcze do drugiego, a szkice gotowe do zatwierdzenia do trzeciego. Sztuczka polega na zaprojektowaniu logiki przekazywania, zamiast udawać, że jeden model powinien być równie dobry we wszystkich trzech zadaniach.
Co to oznacza dla zespołów wybierających modele do burzy mózgów
Jeśli te wieści się potwierdzą, wniosek nie brzmi, że główne LLM-y są złe w generowaniu treści przez AI. Chodzi o to, że wiele zespołów używało ich z niewłaściwą metryką sukcesu. W przypadku kodowania, syntezy i stabilnego szkicowania, przeciętne odpowiedzi są często dokładnie tym, czego potrzebujesz. W przypadku burzy mózgów, przeciętne odpowiedzi są miejscem, w którym oryginalna praca zostaje spłaszczona.
Więc nie czytałbym Flint jako historii o zastępowaniu. Czytałbym to jako historię o routingu:
- używaj głównych modeli do spójności, ram badawczych i ustrukturyzowanych szkiców
- używaj modeli o dużej różnorodności do nazewnictwa, haczyków, metafor i dywergencji koncepcji
- porównuj wyniki obok siebie, zanim ktokolwiek zacznie edytować
- utrzymuj ludzi odpowiedzialnych za gust, dopasowanie do marki i roszczenia faktyczne
Ten przepływ pracy zmniejsza również jedną częstą awarię, którą ciągle widzę w usługach integracji AI: zespoły automatyzują zbyt wcześnie. Podłączają model do potoku treści, a dopiero później zdają sobie sprawę, że każda kampania brzmi teraz statystycznie znajomo. Różnorodność łatwiej przetestować, zanim warstwa automatyzacji stwardnieje wokół pierwszej konfiguracji.
Wnioski dla programów adopcji AI
Historia Springboards jest przydatna, ponieważ przeformułowuje ukryte ograniczenie. Wiele zespołów uważa, że ich promptowanie jest słabe, podczas gdy prawdziwym problemem jest to, że rodzina modeli zbiega się do tych samych bezpiecznych wyników. Lepsze prompty pomagają, ale nie rozwiązują w pełni problemu homogeniczności modelu.
Należy obserwować, czy więksi dostawcy udostępnią bardziej precyzyjne kontrolki dla kontrolowanej nowości zamiast tępej losowości. Obserwuj również, czy zespoły marketingowe i medialne zaczną oceniać wyniki modeli pod kątem odrębności, a nie tylko szybkości i spójności. Byłby to bardziej uczciwy punkt odniesienia dla kreatywnej pracy AI w 2026 roku.
Napisane przez zespół Encorp. Porozmawiaj z nami: zarezerwuj 30-minutową rozmowę lub śledź nas na LinkedIn.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation