FLoC: cos’è Federated Learning of Cohorts?
Il 25 gennaio 2021, Google ha presentato in maniera approfondita la visione dell’azienda di un futuro web senza cookie, ma pieno di pubblicità. Nel post del blog “Building a privacy-first future for web advertising” il gigante dei motori di ricerca ha delineato per la prima volta in dettaglio come funzionerà l’attivazione della pubblicità personalizzata se i cookie di terze parti non saranno più supportati. Una parte elementare prevista del progetto Privacy Sandbox è il metodo del cosiddetto Federated Learning of Cohorts (FLoC), in italiano “Apprendimento federato delle coorti”.
Vi sveliamo cosa si nasconde dietro il concetto di FLoC e come dovrebbe funzionare esattamente l’alternativa rispettosa della privacy per la generazione e l’utilizzo di profili utente individuali.
Che cos’è FLoC (Federated Learning of Cohorts)?
Il 14 gennaio 2020, Google ha reso nota pubblicamente la sua intenzione di aggiungere un’API chiamata Federated Learning of Cohorts (FLoC) al proprio browser Chrome. Grazie a questa interfaccia, gli utenti dovrebbero ricevere pubblicità basata sui propri interessi senza che il browser faccia affidamento sui cookie per il tracciamento, evitando di interferire così in modo cruciale con la propria privacy. A tal fine, l’API FLoC si basa su un algoritmo che assegna gli utenti del browser a diverse coorti. I membri di una coorte, che in questo caso possono anche essere indicati come gruppi di interesse, mostrano un comportamento di navigazione simile. Il rispettivo identificativo della coorte (in inglese “cohort id”) ha quindi lo scopo di permettere a Google e ai partner pubblicitari di mostrare in seguito la pubblicità pertinente in modo rispettoso della privacy e conforme sia al regolamento ePrivacy che al nuovo GDPR.
Le coorti non sono uno strumento di analisi web nuovo: specialmente nell’e-commerce, l’analisi delle coorti è stata richiesta per anni come mezzo per comprendere rapidamente il comportamento degli utenti.
Perché FLoC è necessario come nuovo metodo per la pubblicità personalizzata?
Gli annunci pubblicitari sono un mezzo indispensabile per molte aziende per generare traffico per il proprio progetto web e per molti editori un modo altrettanto indispensabile per guadagnare. Gli utenti, d’altra parte, preferiscono gli annunci rilevanti e utili per loro. I cookie o il browser fingerprinting sono stati finora i metodi più semplici e mirati per creare i profili utente necessari. Tuttavia, sono criticati da anni (a ragione) a causa della loro intrusione nella privacy degli utenti del browser. FLoC promette un approccio alternativo che potrebbe soddisfare gli inserzionisti, gli editori e gli utenti, preservando anche la relativa privacy.
Come funziona l’apprendimento federato delle coorti?
L’algoritmo, il componente elementare della tecnologia FLoC, è ancora a uno stadio sperimentale. Il suo funzionamento si può descrivere come segue: sulla base della cronologia del browser, verrebbe assegnato un ID di coorte a un utente che sia rappresentativo dei suoi interessi. Per evitare che l’utente sia riconosciuto sulla base di questo ID, deve condividerlo con almeno un certo numero di utenti di Chrome (un numero concreto non è però ancora disponibile). Sulla base dell’ID, gli editori e gli inserzionisti possono quindi desumere i rispettivi interessi e attivare annunci adeguati, ecc.
Inoltre, Google basa lo sviluppo e l’elaborazione dell’algoritmo sui seguenti principi:
- L’ID della coorte ha lo scopo di impedire il tracciamento cross-site, cioè la raccolta dei dati dai siti web sul comportamento dell’utente.
- Una coorte ha lo scopo di raggruppare gli utenti con un comportamento di navigazione simile.
- L’algoritmo deve basarsi sull’unsupervised learning (apprendimento non supervisionato), cioè deve essere capace di “imparare da solo” senza un intervento esterno.
- L’algoritmo dovrebbe ridurre al minimo l’uso di “numeri magici”, vale a dire che dovrebbe contraddistinguersi per una scelta dei parametri la più semplice e chiara possibile.
- Il calcolo di una coorte FLoC dovrebbe essere il più semplice possibile e richiedere poca capacità di calcolo.
I principi assicurano che la generazione e la gestione delle parti interessate siano trasparenti e facili da capire e non possano essere influenzati dall’esterno. Inoltre, hanno lo scopo di garantire la migliore protezione dei dati possibile, poiché secondo il principio FLoC gli utenti sono anonimizzati all’interno delle loro coorti e vengono raccolti e valutati solo i loro dati.
Il funzionamento di FLoC illustrato con un esempio
Il modo migliore per illustrare esattamente come funziona l’idea del metodo Federated Learning of Cohorts di Google è usare un esempio concreto. Le parti coinvolte nel nostro esempio di FLoC sono le seguenti:
- Utente 1: utente del browser a cui è assegnata la coorte campione 123; vorrebbe comprare delle scarpe sportive online
- Utente 2: utente del browser a cui è anche assegnata la coorte campione 123; vorrebbe aggiornarsi sulle ultime notizie online
- Inserzionista: negozio di moda online che inserisce annunci per i propri prodotti su altri siti web utilizzando piattaforme pubblicitarie
- Editore: sito di notizie aggiornato che visualizza gli annunci pubblicitari, compresi quelli del negozio online di moda
- Piattaforma pubblicitaria: piattaforma che offre strumenti e dati per la visualizzazione di annunci pubblicitari; funge da intermediario tra inserzionista ed editore
Primo passaggio: generazione della coorte
Nella prima fase, il browser o l’algoritmo FLoC su cui il browser si basa crea diversi gruppi di interesse. A ogni coorte viene assegnato un ID unico.
Secondo passaggio: assegnazione dell’ID della coorte
Sulla base della cronologia di navigazione dell’utente 1, il browser determina la coorte corrispondente, che in questo caso è l’ID 123. Il browser dell’utente 2 analizza anche la cronologia di utilizzo per assegnare l’identificativo corrispondente. Anche se la cronologia è leggermente diversa da quella dell’utente 1, è ancora abbastanza simile e perciò all’utente 2 viene assegnato ugualmente l’ID FLoC 123.
Terzo passaggio: visita del negozio online (inserzionista)
L’utente 1 inizia la sua ricerca sul web di scarpe sportive. Si imbatte nel negozio online dell’inserzionista e sfoglia la collezione di scarpe sportive e articoli correlati che gli vengono proposti. Durante questa visita, l’inserzionista riceve l’ID della coorte dell’utente 1 e condivide le conoscenze acquisite sul comportamento d’uso dei membri della coorte 123 con la piattaforma pubblicitaria con cui collabora per inserire gli annunci.
Quarto passaggio: visita della pagina delle notizie (editore)
L’utente 2, alla ricerca delle ultime notizie, arriva sulla pagina di news del nostro editore preso ad esempio e gli fornisce il suo ID di coorte durante il processo. Per far visualizzare all’utente 2 annunci personalizzati, l’editore si rivolge alla piattaforma pubblicitaria con la quale collabora anche il gestore del negozio online. Come parte della richiesta, viene trasmesso anche l’ID di FLoC 123.
Quinto passaggio: determinazione della pubblicità personalizzata appropriata (piattaforma pubblicitaria)
Il fornitore della rete pubblicitaria può ora determinare l’annuncio appropriato per l’utente 2, per il quale ha i seguenti dati grazie all’apprendimento federato delle coorti:
- L’ID di coorte dell’utente 2 (123), trasmesso dall’editore
- i propri dati sugli interessi degli utenti del browser della coorte 123
- i dati trasmessi dall’inserzionista (negozio online) sugli interessi dei prodotti (scarpe da corsa) degli utenti della coorte 123
La piattaforma pubblicitaria inserisce un annuncio per le scarpe da corsa nel negozio online di esempio, poiché è un risultato di visualizzazione adatto per l’utente 2, che viene presentato immediatamente sulla pagina delle notizie, completamente senza l’uso di cookie.
FLoC e protezione dei dati: una simbiosi perfetta?
A prima vista, l’apprendimento federato delle coorti sembra essere la soluzione perfetta per dividere gli utenti del browser in gruppi di interesse senza interferire troppo con la loro privacy. Almeno per il mercato americano, Google sembra non avere dubbi su questa ipotesi: i preparativi per la piena implementazione di FLoC in Chrome sono in pieno svolgimento negli Stati Uniti. Già nel secondo trimestre del 2021, i primi annunci nella rete pubblicitaria di Google Ads saranno eseguiti sulla base della tecnologia FLoC.
Nel frattempo, in Europa, Google ha sospeso i test di Federated Learning of Cohorts. Il principale punto critico è dato dal fatto che non risulta chiaro al momento della creazione delle coorti chi sia il responsabile dei dati e chi si occupi della loro elaborazione. Analizzando la situazione giuridica europea sulla protezione dei dati e la privacy, emergono anche altri punti controversi: l’ID di coorte assegnato che collega gli utenti a un gruppo di interesse, così come tutte le informazioni correlate, potrebbero essere potenzialmente considerati “dati personali”. Inoltre, il trattamento dei dati raccolti e utilizzati per generare le coorti potrebbe anche violare le regole del GDPR|, a meno che Google non ottenga il consenso esplicito degli utenti.
Tuttavia, nel suo ruolo di product manager di Google per il progetto Privacy Sandbox, Marshall Vale si è lasciato sfuggire quanto segue nel marzo 2021:
It’s the start. We are working to begin testing in Europe as soon as possible. We are 100% committed to the Privacy Sandbox in Europe.” – Marshall Vale, Marzo 2021, fonte: https://twitter.com/marshallvale/status/1374494962646020098
Traduzione: È un inizio. Stiamo lavorando per poter iniziare il prima possibile i test in Europa. Siamo impegnati al 100 % per lanciare Privacy Sandbox in Europa. (Tradotto da IONOS)
I responsabili del progetto di Google sono quindi fiduciosi che si potranno iniziare presto i test di FLoC anche in Europa.
Gli amministratori dei siti web hanno la possibilità di bloccare FLoC?
Se siete amministratori di siti web avrete la possibilità di registrarvi o disiscrivervi al progetto Federated Learning of Cohorts. Spetterà a voi decidere se la visita al rispettivo sito web o negozio online deve seguire il metodo delle coorti FLoC o meno. Un punto importante, soprattutto per le pagine web con argomenti sensibili. Inoltre, Google vuole includere un’istanza centrale di protezione che cancella automaticamente certe coorti se hanno un numero elevato di utenti che visitano siti web in categorie sensibili. Il gigante dei motori di ricerca annovera tra le categorie sensibili le tematiche riguardanti le difficoltà finanziarie o la salute mentale.
Decidete di non adottare FLoC aggiungendo la seguente voce nella Permissions Policy dell’header:
interest-cohort=()
Se avete bloccato la tecnologia FLoC in questo modo e volete attivarla di nuovo in un secondo momento, vi basterà rimuovere semplicemente la voce nell’header.
Nei precedenti test di FLoC in Chrome, i siti web che non hanno indicato chiaramente di non volere utilizzare questo metodo sono stati automaticamente inclusi nel calcolo della coorte se Chrome rilevava che si trattava di siti web con annunci o risorse legate alla pubblicità.