Privacy dei dati AI dopo la modifica alla cronologia di ricerca di Google
Google sta introducendo una nuova impostazione chiamata "Search Services History" nei prossimi mesi e, per molti utenti, essa amplia la tipologia di contenuti multimediali legati alla Ricerca che possono essere conservati per il miglioramento dei modelli AI. Questo è importante perché immagini, audio, file e interazioni vocali sono molto più facili da condividere di quanto si pensi, specialmente quando si mescolano abitudini di account personali e lavorativi. Secondo un report di WIRED a firma di Reece Rogers, l'impostazione è apparsa abilitata per impostazione predefinita per almeno alcuni utenti, con l'opzione di salvataggio dei file multimediali anch'essa selezionata.
Il lancio della nuova impostazione "Search Services History" di Google
Non si tratta di una piccola modifica testuale nascosta in una pagina sulla privacy. Google sta facendo emergere un'impostazione legata all'attività di Ricerca che ora copre molto più delle semplici query testuali. Se il tuo team utilizza Google Search, Google Lens o funzioni di ricerca vocale, vale la pena controllare questa impostazione questa settimana, non il prossimo trimestre.
Il problema pratico è semplice: le impostazioni predefinite diventano impostazioni operative. In una collaborazione con un cliente questa primavera, ho scoperto che i dipendenti seguivano le policy scritte per la condivisione di file all'interno di sistemi approvati, per poi utilizzare strumenti di ricerca consumer per rapide ricerche di immagini, OCR e traduzioni, senza rendersi conto che tali caricamenti avevano una propria logica di conservazione. È così che iniziano i problemi di privacy dei dati AI nelle operazioni reali: non con un uso doloso, ma con cinque secondi di comodità.
Google afferma che la funzionalità serve ad aiutare gli utenti a ottenere risultati più pertinenti e a rivedere le ricerche. Un portavoce, Davis Thompson, ha riferito a WIRED che le nuove impostazioni possono essere attivate o disattivate in qualsiasi momento. La domanda più difficile è se gli utenti noteranno i controlli prima che i dati inizino ad accumularsi.
Quali dati Google dichiara di poter conservare
La descrizione di Google è abbastanza ampia da richiedere un'interpretazione letterale da parte dei team di sicurezza e IT. L'azienda afferma che i file multimediali salvati possono includere immagini, file, audio e registrazioni video derivanti dalle interazioni con i servizi di Ricerca. Ciò include elementi come Google Lens, registrazioni da Search Live o dalla pratica di conversazione di Traduttore, contenuti caricati e ricerche vocali, secondo quanto riportato dalla fonte.
Se applichiamo tutto ciò al lavoro quotidiano, la superficie di rischio si amplia rapidamente:
- screenshot condivisi per la risoluzione di problemi
- foto di prodotti caricate per la ricerca inversa di immagini
- frammenti di documenti dei clienti utilizzati nei flussi di ricerca
- audio acquisito durante la traduzione o la ricerca vocale
Ho visto team dare per scontato che "dati di ricerca" significasse stringhe di testo. Spesso non è così. Una volta che i file multimediali entrano nel flusso, la sicurezza dei dati AI smette di essere solo un problema di cronologia del browser e inizia ad assomigliare a una gestione incontrollata dei file.
Il posto dove verificare è Google Le mie attività, dove la scheda "Search Services History" mostra cosa viene salvato e se la conservazione dei file multimediali è abilitata. Anche la più ampia documentazione di supporto per Attività web e app di Google è rilevante, poiché i controlli della cronologia a livello di account possono influenzare lo stato predefinito visualizzato dagli utenti.
Perché le impostazioni di privacy predefinite creano rischi operativi
Il rischio maggiore non è che Google sia particolarmente aggressiva. Il segnale più importante è che la raccolta di dati per l'AI consumer sta diventando un comportamento standard del prodotto e l'onere di disattivare tale opzione ricade sull'utente. Ciò ha implicazioni dirette per la sicurezza dell'AI aziendale, specialmente nelle aziende che consentono un uso leggero di strumenti consumer per ricerca, traduzione o supporto.
WIRED ha riferito che, quando la funzione veniva disattivata, Google mostrava un avviso indicante che i dati di addestramento potrebbero essere conservati fino a quattro anni, anche se l'attività originale viene eliminata. Questa finestra di conservazione è l'aspetto che segnalerei per primo in qualsiasi revisione interna. Quattro anni sono più di quanto molti team conservino i file di lavoro in circolazione attiva. Se uno screenshot o un campione vocale finisse per errore in una pipeline di miglioramento del modello, il percorso di pulizia sarebbe molto più complesso di quanto si pensi.
È qui che una breve guida interna aiuta più di un lungo PDF di policy. I team hanno bisogno di un set di regole di una pagina: cosa non caricare, quali impostazioni disabilitare e quando passare a soluzioni AI private per lavori sensibili. Se stai formalizzando tale guida, una pagina sull'analisi dei dati AI per progetti di ricerca è la risorsa più vicina sul lato Encorp, poiché incentra la gestione sicura e i controlli della privacy attorno ai flussi di lavoro basati sull'AI.
Esiste un compromesso. Disattivare la conservazione potrebbe ridurre la comodità per chi desidera una cronologia di ricerca più ricca e un richiamo cross-modale. Ma questo è esattamente il punto della privacy dei dati AI: rendere il compromesso visibile prima che sia il sistema a farlo per te.
Come disattivare l'opzione in Google Le mie attività
Il percorso rapido è semplice.
- Vai su Google Le mie attività.
- Apri la sezione Search Services History se è visibile sul tuo account.
- Disattiva l'impostazione se non vuoi che le interazioni di Ricerca vengano conservate per il miglioramento del modello.
- Deseleziona specificamente Salva file multimediali, in modo che immagini, file, audio e video caricati non vengano conservati con tale impostazione.
- Rivedi ed elimina le attività correlate esistenti, se necessario.
Consiglierei ai dipendenti di farlo sia sugli account personali che su quelli utilizzati per lavoro. In pratica, le persone confondono continuamente i confini. Accedono a un profilo del browser per comodità, trascinano un'immagine da una cartella del desktop, testano una frase su Traduttore e vanno avanti. Sei mesi dopo, nessuno ricorda quale account ha gestito cosa.
Per gli amministratori, questo è anche un problema di comunicazione. Non è necessaria una migrazione completa della piattaforma per rispondere. Serve un breve messaggio con screenshot, un esercizio di verifica di 10 minuti e un elenco di alternative approvate per i contenuti sensibili. I team che gestiscono bene la situazione trattano le impostazioni di privacy allo stesso modo dell'attivazione dell'MFA: come un controllo operativo ripetibile, non come un annuncio una tantum.
Cosa segnala questo lancio sulla raccolta dati dell'AI consumer
Il modello generale è chiaro. I prodotti di ricerca si stanno trasformando in pipeline di addestramento, perché i dati multimodali sono utili. Le immagini mostrano l'intento in modo diverso dal testo. La voce aggiunge contesto. I file rivelano schemi di attività. Per chi costruisce modelli, questo è un input prezioso. Per gli utenti, significa che le interazioni di routine ora hanno un secondo scopo oltre al compito immediato.
Google non è sola in questo. I controlli sulla privacy consumer di OpenAI e l'informativa sulla privacy di Microsoft mostrano la stessa direzione di mercato: più funzionalità AI, più impostazioni, maggiore responsabilità da parte dell'utente nell'ispezionare le impostazioni predefinite. La differenza in questo caso è quanto siano concrete le categorie multimediali e quanto direttamente si colleghino a un comportamento di Ricerca che le persone considerano già usa e getta.
Ciò che osserverei in seguito è se Google cambierà la presentazione predefinita, aggiungerà una guida più chiara per gli amministratori o separerà più esplicitamente la cronologia di comodità dal consenso al miglioramento del modello. Se questo lancio rimarrà gestito principalmente dall'utente, aspettati che più aziende restringano le regole di utilizzo accettabile per gli strumenti di ricerca e traduzione consumer. Il titolo sulla privacy è importante, ma la storia operativa è più grande: la privacy dei dati AI è ora parte della normale igiene del browser.
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation