El desarrollo de agentes de IA funciona mejor sin enmarcarlos como compañeros de trabajo
El 29 de junio de 2026, MIT Technology Review publicó un hallazgo que debería hacer que todo líder de operaciones revisara cómo se introducen los agentes de IA en la empresa: los gerentes detectaron un 18% menos de errores cuando el mismo resultado se presentaba como proveniente de un empleado de IA en lugar de un chatbot. Para un mercado ahora saturado de lanzamientos de agentes de Microsoft, OpenAI, Anthropic, Google y Nvidia, eso es más que un problema de lenguaje. Lo que esto significa en realidad es que el desarrollo de agentes de IA puede fallar en la capa de supervisión antes de fallar en la capa del modelo. Según el informe de MIT Technology Review sobre la investigación de Emma Wiles, la etiqueta misma cambia cómo las personas revisan el trabajo.
Los agentes de IA se venden como compañeros de trabajo y eso distorsiona la función que deben cumplir
La narrativa del mercado sobre agentes de IA personalizados ha cambiado rápidamente en 2026. Las demostraciones de productos describen cada vez más a los agentes como compañeros de equipo, empleados digitales o colaboradores autónomos en lugar de software con responsabilidades delimitadas. Jensen Huang de Nvidia ha utilizado el lenguaje de humanos digitales, mientras que las principales plataformas como Microsoft, OpenAI, Anthropic y Google han impulsado más productos orientados a agentes al mercado.
Ese enfoque suena intuitivo porque asigna agentes de automatización de IA a un organigrama que los ejecutivos ya comprenden. Pero también introduce una suposición incorrecta: que la herramienta posee algo similar al juicio humano, la propiedad del rol o la responsabilidad. En la práctica, la mayoría de los agentes empresariales se entienden mejor como componentes de flujo de trabajo dentro de la automatización de flujos de trabajo de IA, no como miembros del personal con discreción.
El estudio de Emma Wiles es útil precisamente porque aísla el efecto del nombre. El resultado no se volvió más confiable. Los revisores simplemente se volvieron menos precisos una vez que creyeron que una entidad similar a un compañero de trabajo lo había producido. Para las empresas que planean servicios de implementación de IA en soporte, operaciones o trabajo de conocimiento, esa es una advertencia de que el lenguaje de la interfaz y los mensajes de lanzamiento forman parte del diseño del sistema.
Lo que dice la investigación sobre la detección de errores y la responsabilidad
El resultado de Boston University importa porque mide un costo empresarial que muchos equipos pasan por alto: la revisión humana degradada. Cuando los participantes pensaron que el trabajo provenía de un empleado de IA, no solo detectaron menos errores, sino que también se sintieron menos personalmente responsables de corregirlos. El artículo original reporta que fueron un 44% más propensos a escalar trabajo cuestionable a un gerente en lugar de corregirlo ellos mismos.
Ese intercambio es grave. El supuesto valor de los servicios de integración de IA es un mayor rendimiento con supervisión consistente. Pero cuando el enfoque de estilo empleado debilita la revisión de primera línea, los equipos vuelven a agregar latencia al proceso. Ahorran minutos en la redacción, pero luego los pierden en escalamiento, retrabajo e incertidumbre sobre quién toma la decisión final.
Del manual de Encorp: El primer modo de falla en los lanzamientos de agentes a menudo no es la precisión del modelo, sino la confusión de roles. Cuando se dice a los gerentes que un agente es un compañero de equipo, revisan el resultado socialmente; cuando se les dice que es una herramienta de alta varianza, revisan el resultado operativamente. Esa diferencia es por qué la capacitación debe venir antes que la escala en los Servicios de Integración de IA para Microsoft Teams.
También existe un problema de responsabilidad más profundo. En entornos como salud, servicios profesionales y aprobaciones internas, cada resultado de IA necesita un propietario humano explícito. Si esa propiedad se vuelve difusa, la organización crea una brecha silenciosa entre quién tocó el trabajo y quién es responsable de él. Eso no es una preocupación de gobernanza abstracta; afecta la calidad, la auditabilidad y la adopción.
Por qué antropomorfizar agentes crea riesgos empresariales de segundo orden
El problema de primer orden es una menor precisión. El problema de segundo orden es que un mal enfoque puede remodelar el comportamiento en todo el modelo operativo.
Comience con las expectativas. Si se dice a los gerentes que recibirán compañeros de trabajo, esperan iniciativa, juicio y conciencia contextual. La mayoría de los agentes actuales no ofrecen eso de manera consistente. Pueden realizar tareas estrechas bien, especialmente cuando se les dan entradas estables y acceso claro a herramientas, pero siguen siendo frágiles ante la ambigüedad, los casos extremos y los objetivos conflictivos. Como argumentó el economista Daron Acemoglu en la cobertura de Technology Review, la IA debería mejorar las capacidades humanas en lugar de comercializarse como un reemplazo de ellas.
Luego considere la culpa. En trabajo regulado o de alto riesgo, el enfoque antropomórfico brinda a las organizaciones una conveniente salida retórica. Si un agente se trata como un pseudoempleado, los malos resultados pueden narrarse como un error de la herramienta en lugar de una elección de diseño sobre aprobaciones, rutas de escalamiento o umbrales de revisión. Esa es exactamente la incentivo incorrecto para los servicios de implementación de IA. Los sistemas deberían hacer la responsabilidad más clara, no más fácil de desplazar.
Aquí es donde el diseño del panel de operaciones de IA también importa. Los equipos a menudo rastrean velocidad, volumen y tasas de finalización de agentes, pero no suficientes métricas de revisión: tasa de anulación, tasa de corrección, tasa de escalamiento y tiempo hasta aprobación final. Sin esos contadores, una empresa puede pensar que la automatización está funcionando bien mientras los revisores humanos se vuelven silenciosamente menos efectivos.
Lo que los trabajadores realmente quieren que hagan los agentes de IA es más estrecho de lo que los proveedores sugieren
Un ángulo comparativo útil proviene de la investigación de Stanford sobre trabajadores, también citada en el artículo original. Según el Stanford Institute for Human-Centered AI, la preferencia de los trabajadores a menudo diverge de lo que los expertos externos asumen que debería automatizarse. En el ejemplo destacado por Technology Review, los asistentes legales dieron la bienvenida al soporte que ayudaba a rastrear el progreso entre casos, pero los representantes de ventas rechazaron ciertas tareas de verificación intensiva que otros habían marcado como fuertes candidatas a automatización.
Esa diferencia es estratégica, no cosmética. Los trabajadores tienden a valorar más el entrenamiento de IA y el soporte de agentes cuando el sistema reduce la carga de coordinación, revela información faltante o prepara un borrador para revisión. Resisten cuando el agente se entromete en tareas de alto juicio donde el contexto, la sutileza o la confianza importan más que el rendimiento.
Para el desarrollo de agentes de IA, esto crea una regla de diseño práctica: comience con tareas de soporte donde los resultados son fáciles de verificar y la propiedad es obvia. Eso incluye triaje, resumen, mensajes de seguimiento, monitoreo de flujos de trabajo y comparación contra reglas conocidas. Sea más cauteloso con tareas que impliquen juicio final, certificación de calidad o manejo de excepciones a menos que la arquitectura de revisión sea madura.
En servicios profesionales, por ejemplo, un agente que marca cláusulas contractuales para revisión humana puede encajar bien. Un agente descrito como un revisor de acuerdos autónomo probablemente creará tanto confianza excesiva como resistencia. En salud, un agente que organiza documentación previa puede ayudar; un agente presentado como un compañero de trabajo clínico invita al nivel incorrecto de confianza.
Cómo posicionar el desarrollo de agentes de IA para la adopción sin reducir la supervisión
La lección operativa es directa: describa los agentes por función, no por identidad. Use lenguaje de tareas como monitorear, resumir, comparar, enrutar o redactar. Evite el lenguaje de títulos de trabajo a menos que el sistema realmente lleve los controles, la trazabilidad de auditoría y la lógica de aprobación que ese rol requeriría.
Un segundo principio es asignar un propietario humano para cada resultado de agente que importe. Ese propietario debería conocer el umbral de revisión, la ruta de escalamiento y cuándo no confiar en el sistema. Aquí es donde el entrenamiento de IA no es una actividad secundaria sino parte de la implementación. Si no se enseña a los gerentes cómo inspeccionar los resultados del agente, la empresa está escalando un problema de supervisión junto con el software.
Un tercer principio es medir el rendimiento humano después del despliegue, no solo la actividad del agente. Una buena automatización de flujos de trabajo de IA debería reducir las tasas de error y evitar escalamientos innecesarios. Si la calidad de la revisión cae después del lanzamiento, el problema puede ser el enfoque, el diseño del flujo de trabajo o los incentivos, en lugar del modelo solo.
Para los equipos que construyen un programa de varias etapas, la secuencia importa más que el eslogan. Capacitar a los gerentes en el modelo mental correcto antes del lanzamiento general a menudo es más valioso que agregar otro agente a la pila. Las empresas que lo hagan bien no serán las que tengan las herramientas más humanas. Serán las que hagan la supervisión visible, medible y normal.
Preguntas frecuentes
¿Cuál es el principal riesgo de llamar compañeros de trabajo a los agentes de IA?
El mayor riesgo es conductual. Cuando las personas ven a un agente como un compañero de trabajo en lugar de una herramienta, pueden revisar menos cuidadosamente, sentirse menos responsables de los errores y escalar más a menudo. Eso reduce las ganancias de velocidad y calidad que el sistema debía crear.
¿Cuál es una mejor forma de introducir los agentes de IA a los equipos?
Introdúzcalos mediante lenguaje basado en tareas. Explique qué hace el agente, dónde puede actuar, qué debe revisar un humano y quién es el propietario del resultado final. Eso mantiene las expectativas realistas y facilita la gobernanza de la adopción.
¿Cuáles casos de uso de desarrollo de agentes de IA son más seguros para comenzar?
Los mejores casos de uso iniciales son tareas repetitivas y verificables con entradas y salidas claras, como triaje, resumen, monitoreo y redacción de borradores. Estos encajan bien en bucles de revisión humana sólidos y son más fáciles de mejorar con el tiempo que decisiones de alto juicio.
Etiquetas
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation