Confidentialité des données IA après le changement d'historique de recherche de Google
Google déploie progressivement un nouveau paramètre d'historique des services de recherche au cours des prochains mois, et pour de nombreux utilisateurs, il élargit les médias liés à la recherche qui peuvent être conservés pour l'amélioration des modèles d'IA. C'est important car les images, l'audio, les fichiers et les interactions vocales sont beaucoup plus faciles à partager que la plupart des gens ne le pensent, notamment dans le cadre d'habitudes mixtes entre comptes personnels et professionnels. Selon un reportage de WIRED par Reece Rogers, le paramètre est apparu activé par défaut pour au moins certains utilisateurs, avec la conservation des médias également cochée.
Le nouveau paramètre d'historique des services de recherche de Google est en cours de déploiement
Il ne s'agit pas d'un simple changement de formulation enfoui dans une page de confidentialité. Google met en avant un paramètre lié à l'activité de recherche qui couvre désormais plus que les requêtes tapées. Si votre équipe utilise Google Search, Google Lens ou des fonctionnalités de recherche vocale, ce déploiement mérite d'être vérifié cette semaine, pas le trimestre prochain.
Le problème pratique est simple: les paramètres par défaut deviennent des paramètres de production. Lors d'une mission client ce printemps, j'ai constaté que les employés suivaient la politique écrite pour le partage de fichiers dans les systèmes approuvés, puis utilisaient des outils de recherche grand public pour des recherches rapides d'images, de l'OCR et de la traduction sans se rendre compte que ces téléchargements avaient leur propre logique de conservation. C'est ainsi que les problèmes de confidentialité des données IA commencent dans les opérations réelles: non pas par une utilisation malveillante, mais par cinq secondes de commodité.
Google affirme que cette fonctionnalité est destinée à aider les utilisateurs à obtenir des résultats plus pertinents et à revoir leurs recherches. Un porte-parole, Davis Thompson, a déclaré à WIRED que les nouveaux paramètres peuvent être activés ou désactivés à tout moment. La question plus difficile est de savoir si les utilisateurs remarqueront les contrôles avant que les données ne commencent à s'accumuler.
Quelles données Google dit pouvoir conserver
La description de Google est suffisamment large pour que les équipes de sécurité et informatiques doivent la prendre au pied de la lettre. L'entreprise indique que les médias sauvegardés peuvent inclure des images, des fichiers, de l'audio et des enregistrements vidéo provenant d'interactions avec les services de recherche. Cela inclut des éléments tels que Google Lens, des enregistrements de Search Live ou de la pratique de parole de Translate, du contenu téléchargé et des recherches vocales, selon le reportage source.
Si vous mappez cela sur le travail quotidien, la surface de risque s'élargit rapidement:
- captures d'écran partagées pour le dépannage
- photos de produits téléchargées pour une recherche d'image inversée
- extraits de documents clients utilisés dans les flux de recherche
- audio capturé lors de la traduction ou de la recherche vocale
J'ai vu des équipes supposer que « les données de recherche » signifient des chaînes de texte. Ce n'est souvent pas le cas. Une fois que les médias entrent dans le flux, la sécurité des données IA cesse d'être simplement un problème d'historique de navigateur et commence à ressembler davantage à une gestion de fichiers non contrôlée.
L'endroit pour vérifier cela est Google Mon activité, où l'onglet Historique des services de recherche montre ce qui est sauvegardé et si la conservation des médias est activée. La documentation d'aide sur l'activité Web et applications de Google est également importante ici car les contrôles d'historique au niveau du compte peuvent affecter l'état par défaut que voient les utilisateurs.
Pourquoi les paramètres de confidentialité activés par défaut créent un risque opérationnel
Le plus grand risque n'est pas que Google soit particulièrement agressif. Le signal plus important est que la collecte de données IA grand public devient un comportement de produit normal, et que le fardeau de l'opt-out est transféré à l'utilisateur. Cela a des implications directes pour la sécurité IA en entreprise, notamment dans les entreprises qui autorisent une utilisation légère des outils grand public pour la recherche, la traduction ou le travail de support.
WIRED a rapporté que lorsque la fonctionnalité était désactivée, Google affichait un avis indiquant que les données d'entraînement pouvaient être conservées jusqu'à quatre ans, même si l'activité originale était supprimée. Cette fenêtre de conservation est la partie que je signalerais en premier dans toute révision interne. Quatre ans, c'est plus longtemps que de nombreuses équipes conservent des fichiers de travail en circulation active. Si une capture d'écran ou un échantillon vocal est entré par erreur dans un pipeline d'amélioration de modèle, le chemin de nettoyage est beaucoup plus étroit que les gens ne le supposent.
C'est là qu'une courte orientation interne aide plus qu'un long PDF de politique. Les équipes ont besoin d'un ensemble de règles d'une page: ce qu'il ne faut pas télécharger, quels paramètres désactiver et quand passer à des solutions d'IA privées pour le travail sensible. Si vous formalisez cette orientation, une page sur l'analyse de données IA pour les projets de recherche est la correspondance la plus proche du côté d'Encorp car elle met l'accent sur la gestion sécurisée et les contrôles de confidentialité autour des flux de données assistés par l'IA.
Il y a un compromis ici. Désactiver la conservation peut réduire la commodité pour les personnes qui souhaitent un historique de recherche plus riche et un rappel multimodal. Mais c'est exactement le point de la confidentialité des données IA: rendre le compromis visible avant que le système ne le fasse pour vous.
Comment se désinscrire dans Google Mon activité
Le chemin rapide est simple.
- Allez sur Google Mon activité.
- Ouvrez la section Historique des services de recherche si elle est visible sur votre compte.
- Désactivez le paramètre si vous ne souhaitez pas que les interactions de recherche soient conservées pour l'amélioration du modèle.
- Décochez spécifiquement Enregistrer les médias, afin que les images, fichiers, audio et vidéos téléchargés ne soient pas conservés sous ce paramètre.
- Examinez et supprimez l'activité existante liée si nécessaire.
Je dirais aux employés de faire cela à la fois sur les comptes personnels et professionnels. En pratique, les gens confondent constamment les deux. Ils se connectent à un profil de navigateur pour plus de commodité, glissent une image depuis un dossier du bureau, testent une phrase dans Translate et passent à autre chose. Six mois plus tard, personne ne se souvient de quel compte a géré quoi.
Pour les administrateurs, c'est aussi un problème de communication. Vous n'avez pas besoin d'une migration complète de plateforme pour répondre. Vous avez besoin d'un court message avec des captures d'écran, un exercice de vérification de dix minutes et une liste d'alternatives approuvées pour le contenu sensible. Les équipes qui le font bien traitent les paramètres de confidentialité de la même manière qu'elles traitent l'inscription MFA: comme une vérification opérationnelle répétable, pas une annonce unique.
Ce que ce déploiement signale sur la collecte de données IA grand public
Le modèle plus large est clair. Les produits de recherche se transforment en pipelines d'entraînement, car les données multimodales sont utiles. Les images montrent l'intention différemment du texte. La voix ajoute du contexte. Les fichiers révèlent des modèles de tâches. Pour les constructeurs de modèles, c'est une entrée précieuse. Pour les utilisateurs, cela signifie que les interactions de routine portent désormais un second objectif au-delà de la tâche immédiate.
Google n'est pas seul ici. Les contrôles de confidentialité des consommateurs d'OpenAI et la déclaration de confidentialité de Microsoft montrent la même direction du marché: plus de fonctionnalités d'IA, plus de paramètres, plus de responsabilité du côté de l'utilisateur pour inspecter les paramètres par défaut. La différence dans ce cas est la concretude des catégories de médias et la manière dont elles sont directement liées au comportement de recherche que les gens traitent déjà comme jetable.
Ce que je surveillerais ensuite est de savoir si Google modifie la présentation par défaut, ajoute une orientation plus claire pour les administrateurs, ou sépare plus explicitement l'historique de commodité du consentement pour l'amélioration du modèle. Si ce déploiement reste principalement géré par l'utilisateur, attendez-vous à ce que davantage d'entreprises resserrent les règles d'utilisation acceptable autour des outils de recherche et de traduction grand public. Le titre de confidentialité est important, mais l'histoire opérationnelle est plus grande: la confidentialité des données IA fait désormais partie de l'hygiène de navigateur de routine.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation