Compresión KV cache: decisión de infraestructura, no hype | encorp.ai