Oszczędności dzięki AI: redukcja SaaS a wydatki na tokeny
Obecnie decyzja nie dotyczy tego, czy kupować AI. Chodzi o to, czy Twoje oszczędności dzięki AI wynikają z realnego zastąpienia oprogramowania, czy z chwilowej luki w budżecie. Widziałem oba przypadki. Jeden zespół rezygnuje z pięciu narzędzi i usprawnia procesy. Inny wdraża copiloty wszędzie, utrzymuje każdą starą subskrypcję, a potem jest zaskoczony, gdy wydatki na tokeny stają się problemem finansowym w trzecim kwartale.
Dlatego przykład 8x8 jest tak istotny. Według doniesień WIRED na temat 8x8 i wykorzystania Claude, firma twierdzi, że obcięła około 5 milionów dolarów rocznych kosztów oprogramowania i narzędzi edukacyjnych, podczas gdy jej roczny rachunek za Claude pozostaje znacznie poniżej tej kwoty. Jednocześnie kadra zarządzająca w firmach takich jak Cisco, Royal Bank of Canada, Amplitude i Box publicznie dyskutuje o budżetach na tokeny, wyborze modeli i rosnącym zużyciu.
Porównanie oszczędności dzięki AI: zastąpienie oprogramowania a wzrost zużycia tokenów
Oto porównanie, które przedstawiłbym zespołowi operacyjnemu, zanim zaczną świętować wczesne sukcesy.
| Kryterium | Przypadek zastąpienia SaaS | Przypadek wzrostu zużycia tokenów |
|---|---|---|
| Główne źródło wartości | Likwidacja nakładających się subskrypcji | Szybsze efekty pracy istniejących zespołów |
| Wpływ na budżet w pierwsze 90 dni | Często wygląda bardzo pozytywnie | Często wygląda na mały, potem szybko rośnie |
| Najlepsze procesy | Pisanie, research, podsumowania, triage wsparcia, wewnętrzne Q&A | Kodowanie, analiza na dużą skalę, automatyzacja wieloetapowa, obsługa klienta |
| Tryb porażki | Zespoły trzymają stare narzędzia, więc oszczędności nie ma | Intensywne użycie modeli premium do zadań o niskiej wartości |
| Kluczowa metryka | Liczba usuniętych licencji na proces | Koszt na proces i na zespół |
| Reakcja finansów | Zadowolenie, jeśli kontrakty faktycznie znikają | Niepokój, jeśli zużycie rośnie szybciej niż przychody |
| Wymagania operacyjne | Redesign procesów i czyszczenie licencji | Routing, monitoring, limity zużycia, dobór modeli |
| Najlepsze dopasowanie Encorp | AI Business Process Automation | Zazwyczaj w parze z dyscypliną AI ops |
Kompromis jest prosty: historie o redukcji kosztów dzięki AI są wiarygodne tylko wtedy, gdy ktoś faktycznie usuwa stare wydatki. W przeciwnym razie AI staje się kolejną warstwą w stosie technologicznym.
8x8 pokazuje, kiedy automatyzacja biznesowa AI naprawdę się zwraca
Przykład 8x8 jest przekonujący, ponieważ nie jest abstrakcyjny. Pracownicy używają Claude do pisania e-maili, analizy opinii klientów i pracy nad kodem. To dokładnie te kategorie, w których zazwyczaj widzę, jak automatyzacja biznesowa AI przynosi szybki zwrot, ponieważ opierają się na narzędziach, które firmy już dawno przepłaciły.
Kluczowy szczegół nie polega na tym, że Claude jest tańszy od ludzi. Kluczowy szczegół polega na tym, że Claude wydaje się tańszy niż chaotyczny zestaw osobnych rozwiązań. To lepsze porównanie. Zespoły finansowe nie dbają o to, czy model wydaje się inteligentny; dbają o to, czy miesięczny stos kosztów stał się mniejszy.
Widziałem to w praktyce: gdy zespół może użyć jednej warstwy AI do pomocy w pisaniu, notatek ze spotkań, analizy i wyszukiwania wewnętrznego, kilka rzadziej używanych narzędzi staje się trudnych do uzasadnienia przy odnowieniu subskrypcji. Ale to działa tylko wtedy, gdy ktoś zarządza listą do usunięcia. Jeśli dział zakupów, IT i kierownicy działów nigdy nie usuwają licencji, oszczędności pozostają fikcyjne.
Dlaczego tokenomika staje się innym problemem na dużą skalę
Druga strona medalu to to, co wiele większych firm opisuje teraz publicznie. Dane z transkrypcji AlphaStreet, cytowane przez TechCrunch, pokazały, że około 300 firm dyskutowało o tokenach AI w kwietniu lub maju, w porównaniu do 93 w tym samym okresie rok wcześniej. RBC podało, że zużycie tokenów wzrosło o 500 procent w ciągu sześciu miesięcy. CEO Cisco stwierdził, że użycie wewnętrznych chatbotów staje się szalone. Aaron Levie z Box powiedział, że budżetowanie tokenów stało się jednym z najbardziej gorących tematów.
Ten wzorzec pokrywa się z tym, czego oczekiwałbym w projektach automatyzacji procesów AI. Gdy firma wychodzi poza zwykłe promptowanie w stronę wbudowanych procesów, trzy rzeczy dzieją się szybko:
- Wolumeny promptów rosną, ponieważ użycie przesuwa się z kilku entuzjastów na całe zespoły.
- Okna kontekstowe rozszerzają się, ponieważ realne procesy wymagają więcej danych.
- Modele premium wkraczają do rutynowych zadań, ponieważ nikt nie ustawił reguł routingu.
To tutaj usługi wdrożeniowe AI zaczynają mieć większe znaczenie niż ogólny entuzjazm. Kosztowne porażki rzadko wynikają z jednego gigantycznego rachunku za model. Wynikają z setek małych, powtarzalnych zapytań powiązanych z procesami, których nikt odpowiednio nie wycenił.
Zasada, której używam: jeśli proces uruchamia się więcej niż 500 razy dziennie, powinieneś znać jego średni koszt w tokenach, model zapasowy, wskaźnik awaryjności oraz to, czy zastąpił starsze narzędzie, czy tylko dodał kolejną zależność.
Małe zespoły i korporacje nie uderzają w tę samą ścianę
Porównałbym wielkość firmy w ten sposób.
Małe i średnie zespoły
Mniejsze zespoły często widzą poprawę produktywności dzięki AI najpierw. Działają szybciej, mają mniej warstw zakupowych i mogą szybko wycofywać oprogramowanie. Marka detaliczna taka jak Baseball Lifestyle 101 może uzasadnić agresywne wydatki na AI, jeśli szybszy proces pomoże zdobyć zamówienie o wartości 1 miliona dolarów, jak podał TechCrunch. W takim przypadku rachunek za tokeny może wzrosnąć, ale przychody mogą go przewyższyć.
Słabością jest dyscyplina procesowa. Mniejsze firmy często używają jednego modelu do wszystkiego, pomijają tagowanie użycia i pozwalają, by wydatki zbyt długo ukrywały się na karcie korporacyjnej.
Duże przedsiębiorstwa
Większe firmy zazwyczaj mają lepszą kontrolę, ale gorszy rozrost. Meta, Uber i Salesforce publicznie zgłaszały obawy dotyczące presji kosztowej generatywnej AI, ponieważ duże struktury tworzą duplikaty narzędzi, nakładające się pilotaże i powolne czyszczenie kontraktów. Użycie AI w przedsiębiorstwie również rozkłada się nierównomiernie. Jeden zespół zyskuje wartość; inny staje się wąskim gardłem.
W praktyce problem dużego przedsiębiorstwa nie polega na dostępie do modeli. Chodzi o utrzymanie usług integracyjnych AI w zgodzie z finansami, IT i operacjami, aby firma nie płaciła dwa razy za ten sam wynik.
Kompromisy operacyjne, które większość kupujących pomija
Oto kompromisy, które ciągle widzę w praktyce.
Kiedy AI zastępuje wydatki na oprogramowanie
Oszczędności są trwałe, gdy warstwa AI przejmuje pracę, która wcześniej wymagała osobnych subskrypcji: asystenci pisania, podsumowywanie spotkań, wewnętrzne wyszukiwanie wiedzy, podstawowe wsparcie analityczne i niektóre narzędzia wsparcia. To najczystsza droga do oszczędności dzięki AI.
Kiedy AI staje się nową pozycją w budżecie
Koszty rosną, gdy zespoły dodają AI do już drogich systemów, nie rezygnując z niczego. Częstym przypadkiem jest firma płacąca za CRM, platformę wsparcia, warstwę BI, narzędzie do zarządzania wiedzą, asystenta kodowania, a na dodatek za ogólny model AI.
Kiedy wybór modelu ma większe znaczenie niż jakość promptu
Wiele zespołów zbyt mocno skupia się na promptowaniu, a za mało na routingu. W jednym z projektów największe oszczędności przyniosło kierowanie zadań klasyfikacji niskiego ryzyka do tańszego modelu i rezerwowanie modeli premium dla trudniejszych przypadków. Ten sam wynik procesu, niższy koszt jednostkowy.
Kiedy oszczędności pracy są realne, ale trudne do zaksięgowania
Oszczędzony czas nie automatycznie staje się oszczędnością w rachunku zysków i strat. Jeśli pracownicy używają AI, aby działać szybciej, ale firma nie zmienia planów zatrudnienia, poziomów usług ani celów przepustowości, zysk jest realny operacyjnie, ale niewidoczny finansowo. To wciąż przydatne, ale nie jest tym samym, co usunięcie kosztów.
Werdykt: wybierz zastąpienie SaaS, jeśli chcesz czystych oszczędności, wybierz skalowanie tokenów, jeśli priorytetem jest szybkość
Gdybym miał sprowadzić to do werdyktu operacyjnego: wybierz ścieżkę zastąpienia SaaS, jeśli chcesz najczystszych i najszybszych oszczędności dzięki AI. Wybierz ścieżkę skalowania tokenów, jeśli celem jest przepustowość, szybkość kodowania lub wzrost przychodów, i bądź gotowy zarządzać tym jak infrastrukturą.
Błędem jest mieszanie tych historii. Nie mów finansom, że to program oszczędnościowy, jeśli nie usuwasz licencji. Nie mów operacjom, że to program szybkościowy, jeśli każdy proces jest wymuszany przez najdroższy model.
Zespoły, które robią to dobrze, traktują AI jak portfel procesów, a nie pojedynczą subskrypcję. Mierzą koszt na proces, wycofane oprogramowanie, miks modeli i adopcję przez zespół. To właśnie tutaj automatyzacja biznesowa AI zmienia się z ciekawego demo w trwałą wartość operacyjną.
Powiązane artykuły
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation