Поверителност на AI данните след промяната в историята на търсенията на Google
Google въвежда нова настройка Search Services History през следващите няколко месеца и за много потребители тя разширява каква медия, свързана с Search, може да се запазва за подобряване на AI модели. Това има значение, защото изображения, аудио, файлове и гласови взаимодействия се споделят много по-лесно, отколкото повечето хора предполагат, особено когато лични и служебни акаунти се смесват в ежедневната работа. Според материал на WIRED от Reece Rogers, настройката е била активирана по подразбиране поне за част от потребителите, като запазването на медия също е било отметнато.
Google’s new Search Services History setting is rolling out
Това не е дребна редакция, скрита в страница за поверителност. Google изважда на преден план настройка, свързана с Search активността, която вече обхваща повече от въведени текстови заявки. Ако екипът ви използва Google Search, Google Lens или функции за търсене с глас, тази промяна си струва да се провери тази седмица, а не следващото тримесечие.
Практическият проблем е прост: настройките по подразбиране бързо се превръщат в настройки в реална употреба. В рамките на един клиентски проект тази пролет видях как служители спазват писмената политика за споделяне на файлове в одобрени системи, а след това използват потребителски инструменти за търсене за бързо намиране на изображения, OCR и превод, без да осъзнават, че тези качвания имат собствена логика за съхранение. Така започват проблемите с AI data privacy в реална среда: не със злонамерено действие, а с пет секунди удобство.
Google казва, че функцията е предназначена да помага на потребителите да получават по-релевантни резултати и да преглеждат отново предишни търсения. Говорителят Davis Thompson е заявил пред WIRED, че новите настройки могат да се включват и изключват по всяко време. По-трудният въпрос е дали потребителите ще забележат тези контроли, преди данните да започнат да се натрупват.
What data Google says it can retain
Описанието на Google е достатъчно широко, за да бъде прочетено буквално от екипите по сигурност и IT. Компанията посочва, че запазената медия може да включва изображения, файлове, аудио и видео записи от взаимодействия със Search услугите. Това включва елементи като Google Lens, записи от Search Live или упражненията за говорене в Translate, качено съдържание и гласови търсения, според цитираната публикация.
Ако го пренесете към ежедневната работа, повърхността на риска бързо се разширява:
- екранни снимки, споделени за отстраняване на проблеми
- продуктови снимки, качени за reverse image lookup
- откъси от клиентски документи, използвани в search процеси
- аудио, записано по време на превод или гласово търсене
Често екипите приемат, че „данни от търсене“ означава само текстови низове. Обикновено не е така. Щом в потока влезе медия, сигурността на AI данните престава да бъде просто проблем с историята на браузъра и започва да прилича повече на неуправлявано боравене с файлове.
Мястото за проверка е Google My Activity, където табът Search Services History показва какво се запазва и дали е активирано съхранение на медия. По-общата документация на Google за Web & App Activity също е важна, защото контролите за история на ниво акаунт могат да влияят на състоянието по подразбиране, което потребителят вижда.
Why default-on privacy settings create operational risk
Най-големият риск не е, че Google е необичайно агресивна. По-важният сигнал е, че събирането на данни от потребителски AI продукти се превръща в нормално продуктово поведение, а тежестта за отказ се прехвърля към потребителя. Това има директни последици за enterprise AI security, особено в компании, които допускат ограничена употреба на потребителски инструменти за проучване, превод или support дейности.
WIRED съобщава, че когато функцията е била изключена, Google е показвала известие, че тренировъчни данни може да се пазят до четири години, дори ако първоначалната активност бъде изтрита. Именно този срок на съхранение бих отбелязал първо при всеки вътрешен преглед. Четири години са повече, отколкото много екипи държат работни файлове в активен оборот. Ако екранна снимка или гласова извадка по погрешка е влязла в pipeline за подобряване на модел, възможностите за последващо почистване са много по-ограничени, отколкото хората предполагат.
Точно тук кратките вътрешни указания помагат повече от дълъг policy PDF. На екипите им трябва правило на една страница: какво да не се качва, кои настройки да се изключат и кога да се премине към private AI решения за чувствителна работа. Ако формализирате такива указания, страница за AI анализ на данни за научноизследователски проекти е най-близкото съответствие от страна на Encorp, защото поставя в центъра сигурната обработка и контролите за поверителност в AI-подкрепени работни потоци с данни.
Тук има компромис. Изключването на съхранението може да намали удобството за хората, които искат по-богата история на търсене и cross-modal recall. Но именно това е смисълът на AI data privacy: компромисът да стане видим, преди системата да го направи вместо вас.
How to opt out in Google My Activity
Бързият път е ясен.
- Отидете на Google My Activity.
- Отворете секцията Search Services History, ако е видима за вашия акаунт.
- Изключете настройката, ако не искате взаимодействията със Search да се запазват за подобряване на модели.
- Махнете отметката от Save media, така че качени изображения, файлове, аудио и видео да не се съхраняват по тази настройка.
- Прегледайте и при нужда изтрийте съществуващата свързана активност.
Бих препоръчал на служителите да направят това и за лични, и за служебно-свързани акаунти. На практика границата често се размива. Хората влизат в един браузърен профил за удобство, плъзгат изображение от папка на десктопа, тестват фраза в Translate и продължават нататък. Шест месеца по-късно никой не помни кой акаунт какво е обработил.
За администраторите това е и комуникационен проблем. Не е нужна пълна миграция на платформа, за да се реагира. Нужно е кратко съобщение със скрийншоти, 10-минутна проверка и списък с одобрени алтернативи за чувствително съдържание. Екипите, които се справят добре, третират настройките за поверителност по същия начин, по който третират активирането на MFA: като повтаряема оперативна проверка, а не като еднократно съобщение.
What this rollout signals about consumer AI data collection
По-широкият модел е ясен. Search продуктите се превръщат в training pipelines, защото мултимодалните данни са полезни. Изображенията показват намерение по различен начин от текста. Гласът добавя контекст. Файловете разкриват модели на работа. За създателите на модели това е ценен вход. За потребителите това означава, че рутинните взаимодействия вече имат втора цел отвъд непосредствената задача.
Google не е единствена. Контролите за поверителност за потребителите на OpenAI и документацията за поверителност на Microsoft показват същата посока на пазара: повече AI функции, повече настройки, повече отговорност за потребителя да проверява какво е включено по подразбиране. Разликата в този случай е колко конкретни са категориите медия и колко пряко са обвързани с Search поведение, което хората и без това приемат за еднократно и незначително.
Следващото, което бих следил, е дали Google ще промени начина на представяне по подразбиране, ще добави по-ясни указания за администратори или ще отдели по-ясно удобната история от съгласието за подобряване на модели. Ако това въвеждане остане предимно управлявано от потребителя, очаквайте повече компании да затегнат правилата за допустима употреба на потребителски инструменти за търсене и превод. Заглавието за поверителност е важно, но оперативната история е по-голяма: AI data privacy вече е част от базовата хигиена на браузъра.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation