Ahorro con IA: recortes de SaaS frente a gasto en tokens
La decisión actual no es si comprar IA. Es si su ahorro con IA proviene de una sustitución real de software o de un punto ciego presupuestario temporal. He visto ambos casos. Un equipo cancela cinco herramientas y obtiene flujos de trabajo más limpios. Otro despliega copilots por todas partes, mantiene todas las suscripciones antiguas y luego se sorprende cuando el gasto en tokens se convierte en un problema financiero para el tercer trimestre.
Por eso importa el último ejemplo de 8x8. Según el reportaje de WIRED sobre 8x8 y el uso de Claude, la empresa afirma haber recortado unos 5 millones de dólares anuales en costes de software y herramientas de formación, mientras que su factura anualizada de Claude sigue muy por debajo de esa cifra. Al mismo tiempo, ejecutivos de empresas como Cisco, Royal Bank of Canada, Amplitude y Box hablan públicamente sobre presupuestos de tokens, elección de modelos y el aumento del consumo.
Comparación de ahorro con IA: sustitución de software frente a crecimiento de tokens
Esta es la comparación que presentaría a un equipo operativo antes de que celebrara victorias prematuras.
| Criterio | Caso de sustitución de SaaS | Caso de crecimiento de tokens |
|---|---|---|
| Fuente principal de valor | Eliminar suscripciones superpuestas | Mayor velocidad de salida de los equipos actuales |
| Efecto presupuestario en los primeros 90 días | Suele parecer claramente positivo | Suele parecer pequeño, pero luego crece rápido |
| Flujos de trabajo más adecuados | Redacción, investigación, resumen, triaje de soporte, preguntas internas | Programación, análisis a gran escala, automatización multietapa, cargas de trabajo orientadas al cliente |
| Modo de fallo | Los equipos mantienen las herramientas antiguas, por lo que los ahorros nunca llegan | Uso intensivo de modelos premium para tareas de bajo valor |
| Métrica que importa | Software neto eliminado por flujo de trabajo | Coste por flujo de trabajo y por equipo |
| Reacción de finanzas | Contentos si los contratos realmente desaparecen | Preocupados si el consumo crece más rápido que los ingresos o los ahorros laborales |
| Requisito operativo | Rediseño de flujos de trabajo y limpieza de licencias | Enrutamiento, supervisión, barreras de uso, selección de modelos |
| Mejor encaje con Encorp | Automatización de procesos de negocio con IA | Suele ir acompañado de una disciplina continua de operaciones de IA |
El equilibrio es sencillo: las historias de reducción de costes con IA solo son limpias cuando alguien elimina el gasto anterior. Si no, la IA se convierte en otra capa más de la pila.
8x8 demuestra cuándo la automatización de negocio con IA realmente rentabiliza
El caso de 8x8 es convincente porque no es abstracto. Los empleados usan Claude para redactar correos, analizar comentarios de clientes y trabajar con código. Esas son exactamente las categorías donde suelo ver que la automatización de negocio con IA genera una recuperación rápida de la inversión, porque se sitúan sobre herramientas que las empresas ya habían comprado en exceso.
El detalle clave no es que Claude sea más barato que las personas. El detalle clave es que Claude parece ser más barato que un conjunto desordenado de soluciones puntuales. Esa es una mejor comparación. Los equipos de finanzas no les importa si un modelo parece inteligente; les importa si la pila mensual se ha reducido.
He visto esto en despliegues en producción: una vez que un equipo puede usar una sola capa de IA para ayuda con la escritura, notas de reuniones, análisis ligero y búsqueda interna, varias herramientas de baja frecuencia se vuelven difíciles de justificar en la renovación. Pero eso solo funciona si alguien se encarga de la lista de limpieza. Si compras, TI y los responsables de departamento nunca eliminan las licencias, los ahorros siguen siendo ficticios.
Por qué la tokenomics se convierte en un problema distinto a escala
El otro lado de la mesa es lo que muchas empresas más grandes están describiendo ahora públicamente. Los datos de transcripciones de AlphaStreet, citados por TechCrunch, mostraron que unas 300 empresas discutían sobre tokens de IA en abril o mayo, frente a 93 en el mismo período del año anterior. RBC afirmó que el uso de tokens aumentó un 500 % en seis meses. El CEO de Cisco dijo que el uso interno de chatbots se estaba volviendo bastante intenso. Aaron Levie de Box dijo que el presupuesto de tokens se había convertido en uno de los temas más candentes.
Ese patrón coincide con lo que esperaría en proyectos de automatización de flujos de trabajo con IA. Una vez que una empresa va más allá de los prompts ocasionales y entra en flujos de trabajo integrados, tres cosas suceden rápido:
- Los volúmenes de prompts aumentan porque el uso pasa de unos pocos entusiastas a equipos completos.
- Las ventanas de contexto se expanden porque los flujos de trabajo reales necesitan más datos.
- Los modelos premium se cuelan en tareas rutinarias porque nadie estableció reglas de enrutamiento.
Aquí es donde los servicios de implementación de IA empiezan a importar más que el entusiasmo general por la IA. Los fracasos costosos rara vez son causados por una única factura de modelo desorbitada. Provienen de cientos de llamadas pequeñas y repetidas vinculadas a flujos de trabajo que nadie presupuestó correctamente.
Una regla que uso: si un flujo de trabajo se ejecuta más de 500 veces al día, debería conocer su coste medio en tokens, el modelo de respaldo, la tasa de fallos y si sustituyó a una herramienta anterior o simplemente añadió otra dependencia.
Los equipos pequeños y las grandes empresas no tropiezan con el mismo muro
Compararía el tamaño de la empresa de esta manera.
Equipos pequeños y medianos
Los equipos más pequeños suelen ver primero las mejoras de productividad con IA. Se mueven más rápido, tienen menos capas de compras y pueden eliminar software con rapidez. Una marca minorista como Baseball Lifestyle 101 puede justificar un gasto agresivo en IA si un flujo de trabajo más rápido ayuda a cerrar un pedido de un millón de dólares, como reportó TechCrunch. En ese caso, la factura de tokens puede aumentar, pero los ingresos pueden superarla.
La debilidad es la disciplina de procesos. Las empresas más pequeñas suelen usar un solo modelo para todo, omiten el etiquetado de uso y dejan que el gasto se oculte durante demasiado tiempo en una tarjeta corporativa.
Grandes empresas
Las empresas más grandes suelen tener mejores controles, pero una peor proliferación de herramientas. Meta, Uber y Salesforce han expresado públicamente sus preocupaciones sobre la presión de los costes de la IA generativa de distintas formas, porque los grandes parques tecnológicos crean herramientas duplicadas, pilotos superpuestos y una limpieza de contratos lenta. El uso de IA en la empresa también se distribuye de forma desigual. Un equipo obtiene valor; otro se convierte en el cuello de botella.
En la práctica, el problema de las grandes empresas no es el acceso a los modelos. Es mantener los servicios de integración de IA alineados con finanzas, TI y operaciones, para que la empresa no pague dos veces por el mismo resultado.
Los equilibrios operativos que la mayoría de compradores pasan por alto
Estos son los equilibrios que sigo viendo en el terreno.
Cuando la IA sustituye el gasto en software
Los ahorros se mantienen cuando la capa de IA absorbe trabajo que antes residía en suscripciones separadas: asistentes de escritura, resumidores de reuniones, búsqueda de conocimiento interno, ayudantes básicos de analítica y parte de las herramientas de soporte. Ese es el camino más limpio hacia el ahorro con IA.
Cuando la IA se convierte en una nueva partida
Los costes suben cuando los equipos añaden IA a sistemas ya costosos sin eliminar nada. La versión habitual es una empresa que paga por un CRM, una plataforma de soporte, una capa de BI, una herramienta de conocimiento, un asistente de programación y luego un modelo de uso general encima de todo ello.
Cuando la elección del modelo importa más que la calidad del prompt
Muchos equipos se centran demasiado en los prompts y no lo suficiente en el enrutamiento. En un proyecto con un cliente, los mayores ahorros vinieron de enviar tareas de clasificación de bajo riesgo a un modelo más barato y reservar la inferencia premium para casos excepcionales. Mismo resultado del flujo de trabajo, menor coste unitario.
Cuando los ahorros laborales son reales pero difíciles de capitalizar
El tiempo ahorrado no se convierte automáticamente en ahorros en la cuenta de resultados. Si los empleados usan la IA para avanzar más rápido pero la empresa no cambia los planes de personal, los niveles de servicio o los objetivos de rendimiento, la ganancia es real operativamente pero invisible financieramente. Eso sigue siendo útil, pero no es lo mismo que un coste eliminado.
Veredicto: elija la sustitución de SaaS si quiere ahorros claros, elija la escala de tokens si la velocidad es la prioridad
Si tuviera que reducir esto a un veredicto operativo, sería este: elija el camino de sustitución de SaaS si quiere el ahorro con IA más limpio y rápido. Elija el camino de escala de tokens si el objetivo es el rendimiento, la velocidad de programación o el aumento de ingresos, y esté preparado para gestionarlo como infraestructura.
El error es mezclar las historias. No le diga a finanzas que esto es un programa de ahorro si no está eliminando licencias. No le diga a operaciones que esto es un programa de velocidad si cada flujo de trabajo se fuerza a través del modelo más caro.
Los equipos que lo hacen bien tratan la IA como una cartera de flujos de trabajo, no como una única suscripción. Miden el coste por flujo de trabajo, el software eliminado, la mezcla de modelos y la adopción por equipo. Ahí es donde la automatización de negocio con IA pasa de ser un valor de demostración interesante a un valor operativo duradero.
Lecturas relacionadas
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation