Economii prin AI: Reducerea costurilor SaaS vs. Consumul de tokenuri
Decizia actuală nu este dacă să cumpărați AI. Este dacă economiile prin AI provin din înlocuirea reală a software-ului sau dintr-un punct mort temporar al bugetului. Le-am văzut pe amândouă. O echipă anulează cinci instrumente și obține fluxuri de lucru mai eficiente. O alta implementează copiloți peste tot, păstrează fiecare abonament vechi și apoi se miră când consumul de tokenuri devine o problemă financiară până în trimestrul al treilea.
De aceea, exemplul recent al 8x8 este important. Conform relatărilor WIRED despre utilizarea Claude de către 8x8, compania susține că a redus aproximativ 5 milioane de dolari din costurile anuale cu software-ul și instrumentele educaționale, în timp ce factura anualizată pentru Claude rămâne mult sub această cifră. În același timp, directori din companii precum Cisco, Royal Bank of Canada, Amplitude și Box discută public despre bugete pentru tokenuri, alegerea modelelor și creșterea utilizării.
Comparația economiilor prin AI: înlocuirea software-ului vs. creșterea consumului de tokenuri
Iată comparația pe care aș prezenta-o unei echipe operaționale înainte de a sărbători succesele timpurii.
| Criteriu | Cazul înlocuirii SaaS | Cazul creșterii consumului de tokenuri |
|---|---|---|
| Sursa principală de valoare | Eliminarea abonamentelor suprapuse | Producție mai rapidă a echipelor existente |
| Efectul bugetar în primele 90 de zile | Adesea pare puternic pozitiv | Adesea pare mic, apoi crește rapid |
| Fluxuri de lucru potrivite | Redactare, cercetare, sumarizare, triaj suport, Q&A intern | Programare, analiză la scară largă, automatizare multi-pas, sarcini cu clienții |
| Mod de eșec | Echipele păstrează vechile instrumente, deci economiile nu apar | Utilizarea intensă a modelelor premium pentru sarcini de mică valoare |
| Metrica relevantă | Software net eliminat per flux de lucru | Cost per flux de lucru și per echipă |
| Reacția financiară | Mulțumiți dacă contractele dispar efectiv | Nervoși dacă utilizarea crește mai repede decât veniturile sau economiile de forță de muncă |
| Cerință operațională | Redesenarea fluxului de lucru și curățarea licențelor | Rutare, monitorizare, reguli de utilizare, selecția modelului |
| Cea mai bună potrivire Encorp | Automatizarea proceselor de afaceri prin AI | De obicei, cuplată cu o disciplină continuă de AI ops |
Compromisul este simplu: poveștile despre reducerea costurilor prin AI sunt clare doar atunci când cineva elimină cheltuielile vechi. Dacă nu, AI devine doar un alt strat în infrastructura tehnologică.
8x8 arată când automatizarea afacerilor prin AI aduce cu adevărat profit
Cazul 8x8 este convingător deoarece nu este abstract. Angajații folosesc Claude pentru redactarea e-mailurilor, analiza feedback-ului clienților și scrierea de cod. Acestea sunt exact categoriile unde văd de obicei automatizarea afacerilor prin AI creând un profit rapid, deoarece se suprapun peste instrumente pe care companiile le-au cumpărat deja în exces.
Detaliul cheie nu este că Claude este mai ieftin decât oamenii. Detaliul cheie este că Claude pare a fi mai ieftin decât un pachet dezordonat de soluții punctuale. Aceasta este o comparație mai bună. Echipelor financiare nu le pasă dacă un model este „inteligent”; le pasă dacă pachetul lunar de cheltuieli a scăzut.
Am văzut acest lucru în implementări live: odată ce o echipă poate folosi un singur strat AI pentru ajutor la scriere, notițe de ședință, analize ușoare și căutare internă, mai multe instrumente cu frecvență redusă devin greu de justificat la reînnoire. Dar acest lucru funcționează doar dacă cineva se ocupă de lista de curățenie. Dacă achizițiile, IT-ul și liderii de departamente nu elimină niciodată licențele, economiile rămân fictive.
De ce tokenomia devine o problemă diferită la scară mare
Cealaltă parte a tabelului este ceea ce multe companii mari descriu acum public. Datele din transcrierile AlphaStreet, citate de TechCrunch, au arătat că aproximativ 300 de companii au discutat despre tokenurile AI în aprilie sau mai, față de 93 în aceeași perioadă a anului precedent. RBC a declarat că utilizarea tokenurilor a crescut cu 500% în șase luni. CEO-ul Cisco a declarat că utilizarea chatbot-ului intern a devenit destul de nebunească. Aaron Levie de la Box a spus că bugetarea tokenurilor a devenit unul dintre cele mai aprinse subiecte.
Acest tipar corespunde cu ceea ce mă aștept în proiectele de automatizare a fluxurilor de lucru prin AI. Odată ce o companie trece de la prompturi ocazionale la fluxuri de lucru integrate, se întâmplă trei lucruri rapid:
- Volumele de prompturi cresc deoarece utilizarea se mută de la câțiva entuziaști la echipe întregi.
- Ferestrele de context se extind deoarece fluxurile de lucru reale necesită mai multe date.
- Modelele premium se strecoară în sarcini de rutină deoarece nimeni nu a stabilit reguli de rutare.
Aici încep serviciile de implementare AI să conteze mai mult decât entuziasmul general pentru AI. Eșecurile costisitoare sunt rareori cauzate de o singură factură uriașă pentru un model. Ele provin din sute de apeluri mici, repetate, legate de fluxuri de lucru pe care nimeni nu le-a evaluat corect.
O regulă pe care o folosesc: dacă un flux de lucru rulează de mai mult de 500 de ori pe zi, ar trebui să cunoașteți costul mediu în tokenuri, modelul de rezervă, rata de eșec și dacă a înlocuit un instrument mai vechi sau doar a adăugat o altă dependență.
Echipele mici și întreprinderile mari nu se lovesc de același zid
Aș compara dimensiunea companiei în acest fel.
Echipe mici și mijlocii
Echipele mai mici văd adesea îmbunătățiri ale productivității prin AI mai întâi. Se mișcă mai repede, au mai puține straturi de achiziție și pot retrage software-ul rapid. Un brand de retail precum Baseball Lifestyle 101 poate justifica cheltuieli agresive pentru AI dacă un flux de lucru mai rapid ajută la obținerea unei comenzi de 1 milion de dolari, așa cum a raportat TechCrunch. În acest caz, factura pentru tokenuri poate crește, dar veniturile pot depăși această cheltuială.
Punctul slab este disciplina proceselor. Firmele mai mici rulează adesea un singur model pentru tot, omit etichetarea utilizării și lasă cheltuielile să se ascundă prea mult timp pe un card corporativ.
Întreprinderi mari
Firmele mai mari au de obicei controale mai bune, dar o dispersie mai mare. Meta, Uber și Salesforce au ridicat public preocupări privind presiunea costurilor AI generative, deoarece structurile mari creează instrumente duplicate, proiecte pilot suprapuse și o curățare lentă a contractelor. Utilizarea AI în întreprinderi se răspândește, de asemenea, inegal. O echipă obține valoare; alta devine blocajul.
În practică, problema întreprinderilor mari nu este accesul la modele. Este menținerea serviciilor de integrare AI aliniate cu finanțele, IT-ul și operațiunile, astfel încât compania să nu plătească de două ori pentru același rezultat.
Compromisurile operaționale pe care majoritatea cumpărătorilor le ratează
Iată compromisurile pe care le văd constant pe teren.
Când AI înlocuiește cheltuielile cu software-ul
Economiile se mențin atunci când stratul AI absoarbe munca care obișnuia să stea în abonamente separate: asistenți de scriere, sumarizatoare de ședințe, căutare de cunoștințe interne, ajutoare de analiză de bază și unele instrumente de suport. Aceasta este cea mai curată cale către economii prin AI.
Când AI devine o nouă linie de cheltuieli
Costurile cresc atunci când echipele adaugă AI la sisteme deja scumpe fără a retrage nimic. Versiunea comună este o companie care plătește pentru un CRM, o platformă de suport, un strat BI, un instrument de cunoștințe, un asistent de programare și apoi un model generalist peste toate acestea.
Când alegerea modelului contează mai mult decât calitatea promptului
Multe echipe se concentrează excesiv pe prompturi și insuficient pe rutare. Într-o colaborare cu un client, cele mai mari economii au venit din trimiterea sarcinilor de clasificare cu risc scăzut către un model mai ieftin și rezervarea inferenței premium pentru cazuri speciale. Același rezultat al fluxului de lucru, cost unitar mai mic.
Când economiile de forță de muncă sunt reale, dar greu de contabilizat
Timpul economisit nu devine automat economii în contul de profit și pierdere. Dacă angajații folosesc AI pentru a se mișca mai repede, dar compania nu schimbă planurile de personal, nivelurile de servicii sau țintele de producție, câștigul este real operațional, dar invizibil financiar. Este totuși util, dar nu este același lucru cu reducerea costurilor.
Verdict: alegeți înlocuirea SaaS dacă doriți economii clare, alegeți scalarea tokenurilor dacă viteza este prioritatea
Dacă ar fi să reduc acest lucru la un verdict operațional, ar fi acesta: alegeți calea înlocuirii SaaS dacă doriți cele mai curate și rapide economii prin AI. Alegeți calea scalării tokenurilor dacă scopul este productivitatea, viteza de programare sau creșterea veniturilor și fiți pregătiți să o gestionați ca pe o infrastructură.
Greșeala este amestecarea poveștilor. Nu spuneți departamentului financiar că acesta este un program de economii dacă nu eliminați licențe. Nu spuneți operațiunilor că acesta este un program de viteză dacă fiecare flux de lucru este forțat prin cel mai scump model.
Echipele care fac acest lucru corect tratează AI ca pe un portofoliu de fluxuri de lucru, nu ca pe un singur abonament. Ele măsoară costul per flux de lucru, software-ul retras, mixul de modele și adoptarea pe echipă. Acolo se transformă automatizarea afacerilor prin AI dintr-o valoare demonstrativă interesantă într-o valoare operațională durabilă.
Lecturi conexe
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation