Confidențialitatea datelor AI după modificarea istoricului căutărilor Google
Google introduce o nouă setare pentru „Istoricul serviciilor de căutare” în următoarele luni, iar pentru mulți utilizatori, aceasta extinde tipul de conținut media legat de căutări care poate fi reținut pentru îmbunătățirea modelelor AI. Acest lucru este important deoarece imaginile, fișierele audio, documentele și interacțiunile vocale sunt mult mai ușor de partajat decât cred majoritatea oamenilor, mai ales în contextul utilizării mixte a conturilor personale și profesionale. Conform unui raport WIRED realizat de Reece Rogers, setarea a apărut activată implicit pentru cel puțin o parte dintre utilizatori, cu opțiunea de salvare a conținutului media bifată.
Noua setare Google pentru Istoricul serviciilor de căutare este în curs de lansare
Aceasta nu este o modificare minoră de formulare ascunsă într-o pagină de confidențialitate. Google scoate în evidență o setare legată de activitatea de căutare care acum acoperă mai mult decât interogările text. Dacă echipa ta folosește Google Search, Google Lens sau funcții de căutare vocală, merită să verifici această lansare săptămâna aceasta, nu în trimestrul viitor.
Problema practică este simplă: setările implicite devin setări de producție. Într-o colaborare cu un client în această primăvară, am descoperit că angajații respectau politica scrisă pentru partajarea fișierelor în sistemele aprobate, dar foloseau instrumente de căutare pentru consumatori pentru căutări rapide de imagini, OCR și traduceri, fără să realizeze că acele încărcări aveau propria logică de retenție. Așa încep problemele de confidențialitate a datelor AI în operațiunile reale: nu prin utilizare malițioasă, ci prin cinci secunde de comoditate.
Google afirmă că funcția este menită să ajute utilizatorii să obțină rezultate mai relevante și să revină la căutările anterioare. Un purtător de cuvânt, Davis Thompson, a declarat pentru WIRED că noile setări pot fi activate sau dezactivate în orice moment. Întrebarea mai dificilă este dacă utilizatorii vor observa aceste controale înainte ca datele să înceapă să se acumuleze.
Ce date spune Google că poate reține
Descrierea Google este suficient de largă încât echipele de securitate și IT ar trebui să o citească literal. Compania spune că mediile salvate pot include imagini, fișiere, înregistrări audio și video din interacțiunile cu serviciile de căutare. Aceasta include elemente precum Google Lens, înregistrări din Search Live sau exerciții de vorbire din Translate, conținut încărcat și căutări vocale, conform raportării sursei.
Dacă aplici acest lucru la munca de zi cu zi, suprafața de risc se extinde rapid:
- capturi de ecran partajate pentru depanare
- fotografii de produs încărcate pentru căutare inversă de imagini
- fragmente din documente ale clienților utilizate în fluxurile de căutare
- conținut audio capturat în timpul traducerii sau căutării vocale
Am văzut echipe care presupun că „datele de căutare” înseamnă doar șiruri de text. De multe ori nu este așa. Odată ce conținutul media intră în flux, securitatea datelor AI încetează să mai fie doar o problemă de istoric al browserului și începe să semene cu gestionarea necontrolată a fișierelor.
Locul unde poți verifica acest lucru este Google My Activity, unde fila „Istoricul serviciilor de căutare” arată ce este salvat și dacă retenția media este activată. Documentația de ajutor Google privind Activitatea pe Web și în Aplicații este, de asemenea, relevantă aici, deoarece controalele istoricului la nivel de cont pot afecta starea implicită pe care o văd utilizatorii.
De ce setările de confidențialitate activate implicit creează riscuri operaționale
Cel mai mare risc nu este că Google este agresiv în mod unic. Semnalul mai important este că colectarea datelor pentru AI-ul de consum devine un comportament normal al produsului, iar sarcina de a renunța (opt-out) se mută asupra utilizatorului. Acest lucru are implicații directe pentru securitatea AI în întreprinderi, în special în companiile care permit utilizarea ușoară a instrumentelor de consum pentru cercetare, traducere sau asistență.
WIRED a raportat că, atunci când funcția a fost dezactivată, Google a afișat o notificare conform căreia datele de antrenament pot fi păstrate până la patru ani, chiar dacă activitatea originală este ștearsă. Această fereastră de retenție este aspectul pe care l-aș semnala primul în orice audit intern. Patru ani reprezintă o perioadă mai lungă decât cea în care multe echipe păstrează fișierele de lucru în circulație activă. Dacă o captură de ecran sau o mostră vocală a intrat din greșeală într-un flux de îmbunătățire a modelului, calea de curățare este mult mai îngustă decât presupun oamenii.
Aici, îndrumările interne scurte ajută mai mult decât un PDF lung cu politici. Echipele au nevoie de un set de reguli pe o singură pagină: ce să nu încarce, ce setări să dezactiveze și când să treacă la soluții AI private pentru munca sensibilă. Dacă formalizezi acele îndrumări, o pagină despre analiza datelor AI pentru proiecte de cercetare este cea mai apropiată resursă de la Encorp, deoarece se concentrează pe manipularea sigură și controalele de confidențialitate în jurul fluxurilor de lucru susținute de AI.
Există un compromis aici. Dezactivarea retenției poate reduce confortul pentru persoanele care doresc un istoric de căutare mai bogat și reamintire cross-modală. Dar acesta este exact scopul confidențialității datelor AI: să facă compromisul vizibil înainte ca sistemul să îl facă în locul tău.
Cum să renunți în Google My Activity
Calea rapidă este simplă.
- Mergi la Google My Activity.
- Deschide secțiunea Istoricul serviciilor de căutare dacă este vizibilă în contul tău.
- Dezactivează setarea dacă nu dorești ca interacțiunile de căutare să fie reținute pentru îmbunătățirea modelului.
- Debifează Salvare conținut media în mod specific, astfel încât imaginile, fișierele, conținutul audio și video încărcate să nu fie reținute sub acea setare.
- Revizuiește și șterge activitatea anterioară legată de acest aspect, dacă este necesar.
Le-aș spune angajaților să facă acest lucru atât pe conturile personale, cât și pe cele adiacente muncii. În practică, oamenii estompează linia tot timpul. Se conectează la un profil de browser pentru comoditate, trag o imagine dintr-un folder de pe desktop, testează o frază în Translate și merg mai departe. Șase luni mai târziu, nimeni nu își mai amintește ce cont a gestionat ce.
Pentru administratori, aceasta este și o problemă de comunicare. Nu ai nevoie de o migrare completă a platformei pentru a răspunde. Ai nevoie de un mesaj scurt cu capturi de ecran, un exercițiu de verificare de 10 minute și o listă de alternative aprobate pentru conținutul sensibil. Echipele care fac acest lucru bine tratează setările de confidențialitate la fel cum tratează înrolarea MFA: ca pe o verificare operațională repetabilă, nu ca pe un anunț unic.
Ce semnalează această lansare despre colectarea datelor AI de consum
Modelul mai larg este clar. Produsele de căutare se transformă în fluxuri de antrenare, deoarece datele multimodale sunt utile. Imaginile arată intenția diferit față de text. Vocea adaugă context. Fișierele dezvăluie tipare de sarcini. Pentru creatorii de modele, acesta este un input valoros. Pentru utilizatori, înseamnă că interacțiunile de rutină poartă acum un al doilea scop dincolo de sarcina imediată.
Google nu este singur aici. Controalele de confidențialitate pentru consumatori ale OpenAI și declarația de confidențialitate a Microsoft arată aceeași direcție a pieței: mai multe funcții AI, mai multe setări, mai multă responsabilitate din partea utilizatorului de a inspecta setările implicite. Diferența în acest caz este cât de concrete sunt categoriile media și cât de direct se leagă de comportamentul de căutare pe care oamenii îl tratează deja ca fiind consumabil.
Ceea ce aș urmări în continuare este dacă Google schimbă prezentarea implicită, adaugă îndrumări mai clare pentru administratori sau separă mai explicit istoricul de comoditate de consimțământul pentru îmbunătățirea modelului. Dacă această lansare rămâne în mare parte gestionată de utilizator, așteaptă-te ca mai multe companii să înăsprească regulile de utilizare acceptabilă în jurul instrumentelor de căutare și traducere pentru consumatori. Titlul despre confidențialitate este important, dar povestea operațională este mai mare: confidențialitatea datelor AI face acum parte din igiena de rutină a browserului.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation