Privacidad de datos en IA tras el cambio en el historial de búsqueda de Google
Google está implementando una nueva configuración de Historial de servicios de búsqueda durante los próximos meses, y para muchos usuarios amplía qué contenido multimedia relacionado con la búsqueda puede retenerse para mejorar los modelos de IA. Esto importa porque las imágenes, el audio, los archivos y las interacciones por voz son mucho más fáciles de compartir de lo que la mayoría cree, especialmente en hábitos mixtos de cuentas personales y laborales. Según un reporte de WIRED por Reece Rogers, la configuración apareció habilitada por defecto para al menos algunos usuarios, con la opción de guardar multimedia también activada.
La nueva configuración de Historial de servicios de búsqueda de Google está en implementación
No se trata de un pequeño cambio de redacción escondido en una página de privacidad. Google está mostrando una configuración vinculada a la actividad de búsqueda que ahora abarca más que las consultas escritas. Si su equipo utiliza Google Search, Google Lens o funciones de búsqueda por voz, vale la pena revisar esta implementación esta semana, no el próximo trimestre.
El problema práctico es simple: las configuraciones por defecto se convierten en configuraciones de producción. En un proyecto con un cliente esta primavera, descubrí que los empleados seguían la política escrita para compartir archivos dentro de los sistemas aprobados, pero luego usaban herramientas de búsqueda de consumo para búsquedas rápidas de imágenes, OCR y traducción sin darse cuenta de que esas cargas tenían su propia lógica de retención. Así es como empiezan los problemas de privacidad de datos en IA en operaciones reales: no con uso malicioso, sino con cinco segundos de conveniencia.
Google dice que la función está diseñada para ayudar a los usuarios a obtener resultados más relevantes y revisar búsquedas anteriores. Un portavoz, Davis Thompson, dijo a WIRED que la nueva configuración puede activarse o desactivarse en cualquier momento. La pregunta más difícil es si los usuarios notarán los controles antes de que los datos empiecen a acumularse.
Qué datos dice Google que puede retener
La descripción de Google es lo suficientemente amplia como para que los equipos de seguridad e IT deban leerla literalmente. La empresa indica que los medios guardados pueden incluir imágenes, archivos, audio y grabaciones de video de interacciones con los servicios de búsqueda. Eso incluye elementos como Google Lens, grabaciones de Search Live o práctica de pronunciación en Translate, contenido cargado y búsquedas por voz, según el reportaje de origen.
Si se traduce eso al trabajo diario, la superficie de riesgo se amplía rápidamente:
- capturas de pantalla compartidas para solucionar problemas
- fotos de productos cargadas para búsqueda inversa de imágenes
- fragmentos de documentos de clientes usados en flujos de búsqueda
- audio capturado durante traducción o búsqueda por voz
He visto equipos asumir que "datos de búsqueda" significa cadenas de texto. A menudo no es así. Una vez que los medios entran en el flujo, la seguridad de datos en IA deja de ser solo un problema de historial del navegador y empieza a parecerse más a una gestión de archivos sin control.
El lugar para verificar esto es Google Mi actividad, donde la pestaña de Historial de servicios de búsqueda muestra qué se está guardando y si la retención de medios está habilitada. La documentación de ayuda de Actividad en la Web y en aplicaciones de Google también es relevante aquí porque los controles de historial a nivel de cuenta pueden afectar el estado por defecto que ven los usuarios.
Por qué las configuraciones de privacidad activadas por defecto crean riesgo operativo
El mayor riesgo no es que Google sea particularmente agresivo. La señal más importante es que la recolección de datos de IA para consumidores se está convirtiendo en un comportamiento de producto normal, y la carga de optar por no participar se está trasladando al usuario. Eso tiene implicaciones directas para la seguridad empresarial de IA, especialmente en empresas que permiten el uso ligero de herramientas de consumo para investigación, traducción o trabajo de soporte.
WIRED reportó que cuando la función estaba deshabilitada, Google mostraba un aviso diciendo que los datos de entrenamiento podían conservarse hasta cuatro años incluso si la actividad original se eliminaba. Esa ventana de retención es la primera parte que señalaría en cualquier revisión interna. Cuatro años es más de lo que muchos equipos mantienen archivos de trabajo en circulación activa. Si una captura de pantalla o una muestra de voz entraba en un pipeline de mejora de modelos por error, el camino de limpieza es mucho más estrecho de lo que la gente asume.
Aquí es donde una guía interna breve ayuda más que un PDF de políticas largo. Los equipos necesitan un conjunto de reglas de una página: qué no cargar, qué configuraciones deshabilitar y cuándo cambiar a soluciones de IA privadas para trabajo sensible. Si está formalizando esa guía, una página sobre análisis de datos con IA para proyectos de investigación es la opción más cercana del lado de Encorp porque se centra en el manejo seguro y los controles de privacidad en flujos de trabajo de datos con soporte de IA.
Aquí hay una compensación. Desactivar la retención puede reducir la conveniencia para quienes quieren un historial de búsqueda más rico y recuerdo multimodal. Pero ese es exactamente el punto de la privacidad de datos en IA: hacer visible la compensación antes de que el sistema la haga por usted.
Cómo optar por no participar en Google Mi actividad
La ruta rápida es sencilla.
- Vaya a Google Mi actividad.
- Abra la sección Historial de servicios de búsqueda si está visible en su cuenta.
- Desactive la configuración si no quiere que las interacciones de búsqueda se retengan para la mejora de modelos.
- Desmarque específicamente Guardar medios, para que las imágenes, archivos, audio y video cargados no se retengan bajo esa configuración.
- Revise y elimine la actividad relacionada existente si es necesario.
Yo diría a los empleados que hagan esto tanto en cuentas personales como en las relacionadas con el trabajo. En la práctica, la gente confunde la línea todo el tiempo. Inician sesión en un perfil de navegador por conveniencia, arrastran una imagen desde una carpeta del escritorio, prueban una frase en Translate y siguen adelante. Seis meses después, nadie recuerda qué cuenta manejó qué.
Para los administradores, esto también es un problema de comunicaciones. No se necesita una migración completa de plataforma para responder. Se necesita un mensaje breve con capturas de pantalla, un ejercicio de verificación de 10 minutos y una lista de alternativas aprobadas para contenido sensible. Los equipos que lo hacen bien tratan las configuraciones de privacidad de la misma manera que tratan la inscripción en MFA: como una verificación operativa repetible, no como un anuncio de una sola vez.
Qué señala esta implementación sobre la recolección de datos de IA para consumidores
El patrón más amplio es claro. Los productos de búsqueda se están convirtiendo en pipelines de entrenamiento, porque los datos multimodales son útiles. Las imágenes muestran intención de manera diferente al texto. La voz agrega contexto. Los archivos revelan patrones de tareas. Para los constructores de modelos, eso es una entrada valiosa. Para los usuarios, significa que las interacciones rutinarias ahora tienen un segundo propósito más allá de la tarea inmediata.
Google no está solo aquí. Los controles de privacidad para consumidores de OpenAI y la declaración de privacidad de Microsoft muestran la misma dirección del mercado: más funciones de IA, más configuraciones, más responsabilidad del usuario para inspeccionar los valores por defecto. La diferencia en este caso es cuán concretas son las categorías de medios y cuán directamente se vinculan al comportamiento de búsqueda que la gente ya trata como desechable.
Lo que vigilaría a continuación es si Google cambia la presentación por defecto, agrega guía más clara para administradores, o separa más explícitamente el historial de conveniencia del consentimiento para mejora de modelos. Si esta implementación permanece mayormente gestionada por el usuario, espere que más empresas ajusten las reglas de uso aceptable en torno a herramientas de búsqueda y traducción de consumo. El titular de privacidad es importante, pero la historia operativa es más grande: la privacidad de datos en IA ya es parte de la higiene rutinaria del navegador.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation