Raccontare Amazon, Netflix, Facebook e Google per mezzo dei loro algoritmi di scelta e dei (nostri) dati di cui hanno bisogno per funzionare.

Il computer che sa cosa vuoi prima ancora che tu lo voglia. Amazon che ci propone libri o altri oggetti che scopriamo ci piacciono, Netflix che ci suggerisce film e telefilm sulla base di quanto già visto prima. Sembra magia ma, come diceva Arthur C. Clarke, qualsiasi tecnologia sufficientemente avanzata è indistinguibile dalla magia. Solo che non lo è.

Gli algoritmi di scelta sono infatti tutt’altro che magici: nascono da ricerche iniziate nel campo dell’intelligenza artificiale negli anni Cinquanta e Sessanta (ma si potrebbero citare anche George Boole nell’Ottocento e Alan Turing prima della Seconda guerra mondiale), sono evoluti con le reti neurali e con le analisi di dati accumulati per decenni per arrivare ai risultati di oggi. La svolta è giunta con la quantità sempre crescente di dati, diventata big data grazie alla crescita di apparecchi digitali connessi alla rete e all’abitudine dei consumatori di interagire sempre più spesso con servizi cloud. E che, con l’alba della internet of things (che poi per chi lavora con gli algoritmi di scelta vuol dire poter raccogliere più dati grazie a più apparecchi e sensori connessi alla rete) diventeranno presto very big data.

Ma dove inizia la storia degli algoritmi di scelta? Se esiste un punto di svolta è quello che ha a che fare con uno dei più grandi risultati simbolici raggiunti dalla grande distribuzione negli Stati Uniti.

Alla ricerca della donna incinta

C’è un racconto tramandato dalle tribù del marketing strategico, una specie di rito d’iniziazione a uso e consumo degli studenti degli MBA. È la storia di Andrew Pole, uno statistico (oggi diremo un data scientist) che nel 2002 lavorava per Target, il colosso della distribuzione americana. La versione della storia raccontata dal New York Times rivela che Pole, un vero nerd per la matematica e la statistica, era ossessionato dall’idea di poter raggiungere il santo graal degli algoritmi di scelta. Capire quando una donna è incinta anche se non lo vuole rivelare (o addirittura non lo sa).

Capire se una cliente è incinta serve ovviamente a proporle nuovi prodotti legati alla maternità, uno dei periodi più interessanti per la vendita di tanti prodotti diversi. Pole aveva capito che l’arrivo della maternità porta con sé una serie di cambiamenti più o meno consapevoli nelle abitudini. Al punto da tratteggiare con decisione gli elementi che permettono, tramite l’analisi di alcuni mesi degli scontrini di un profilo di cliente (il Guest ID, che raccoglie tutti i dati delle carte fedeltà, coupon e carte di credito di una particolare persona), se effettivamente la probabilità di una gravidanza sono positive. Come ha spiegato Pole, “sapevamo che se avessimo potuto identificare le nuove madri entro il loro secondo trimestre di gravidanza, avremmo avuto una buona probabilità di catturarle per anni: quando iniziano a comprare i pannolini da noi poi comprano anche tutto il resto nello stesso posto”.

Il punto di svolta arrivò quando l’azienda iniziò a inviare comunicazioni push proponendo prodotti per la maternità a persone che ancora non avevano partorito, sulla base di quelli che si chiamano predictive analytics. E addirittura a persone che non avevano neanche dichiarato la propria gravidanza: come la ragazza il cui padre che protestò vivacemente con Target perché inviava pubblicità di prodotti per la maternità a sua figlia minorenne, salvo poi dover ammettere che aveva avuto ragione l’azienda quando la ragazza rivelò di essere incinta davvero. La conseguenza, spiega Pole, fu che Target cominciò a mandare pubblicità di prodotti per la maternità in volantini che li mescolavano con altre tipologie di prodotti: in questo modo potevano far credere ai loro bersagli di comunicazione (le future neo-madri) che si trattasse semplicemente di un mix casuale per tutti, anziché solo per loro.

Prevedere i comportamenti, studiare le abitudini

La storia di Target è significativa da un punto di vista simbolico, ma non è certo l’unico caso. Negli Stati Uniti (e poi nel resto del mondo) i modelli matematici per cercare di prevedere i comportamenti di acquisto, e più in generale le abitudini di comportamento dei clienti e dei cittadini, sono usate da aziende e servizi pubblici. Aiutano ad esempio la pianificazione negli ospedali o individuano nuove modalità di cambiamento dell’organizzazione di un’azienda, e in ogni caso spiegano molte altre cose che noi riteniamo siano figlie del libero arbitrio e in realtà la gran parte delle volte (secondo quanto sostengono le neuroscienze) appartengono invece al dominio delle abitudini. Cioè dei comportamenti a cui diamo forma a livello inconscio.

Le abitudini nascono dalla ripetizione più o meno volontaria dei comportamenti e sono il modo con cui il nostro cervello cerca di risparmiare energia mantenendo un livello di funzionamento adeguato. Gli studi sul comportamento possono decodificare i tipi di abitudine delle persone e prevedere cosa farà un individuo. Oppure cosa gli piace, dato che anche i gusti nascono e funzionano in maniera simile alle abitudini. Capito il pattern, si riesce a prevedere e alimentare la tipologia di scelta di un utente.

Amazon ha lavorato tantissimo su questi meccanismi su due fronti. Da un lato studiando le abitudini di lettura dei suoi clienti in base agli acquisti e alla visione di prodotti, dall’altro investendo moltissimo sul desiderio degli utenti stessi di partecipare alla definizione dei modelli. Non solo con le recensioni dei libri e degli altri oggetti (che poi sono il sistema con cui è possibile capire cosa piace e cosa potrebbe piacere a una persona), ma anche dando strumenti per “ripulire” i profili. È infatti possibile togliere il “rumore” eliminando dalla cronologia delle proprie attività le visualizzazioni e gli acquisti dei prodotti che magari sono stati fatti per conto di altri e che creerebbero profili contraddittori, e quindi suggerimenti di scelta meno appropriati.

Anche Netflix ha lavorato su due fronti per creare un motore dei suggerimenti funzionante. Con una serie di gare pubbliche ha chiesto agli esperti del settore di proporre soluzioni che fossero almeno del 10% più efficienti del già ottimo motore predittivo sviluppato internamente, e al tempo stesso ha aumentato la quantità di dati che ha a disposizione sui prodotti che trasmette e che i clienti possono scegliere. La base di queste scelte è il punto di partenza da cui sono costruite le scelte di produzione per realizzare nuove serie televisive e film da trasmettere direttamente in streaming su Netflix.

I due grandi campioni degli algoritmi di scelta sono però Google e Facebook (con gli altri social, a partire da Twitter). Apparentemente fanno due lavori molto diversi: Google è molto efficiente a trovare risposte a domande formulate dai suoi utenti (e associare a queste dei contenuti pubblicitari), mentre Facebook è la scatola in cui mettere i contenuti generati dagli utenti. In realtà entrambi presentano una pagina di risultati che devono essere rilevanti: nel caso di Google è la risposta alla domanda dell’utente; nel caso di Facebook è il muro con i contenuti degli amici dell’utente che siano più rilevanti per lui. In buona sostanza, mentre Google risponde a una domanda esplicita, Facebook risponde a una implicita. Entrambi studiano le abitudini degli utenti e propongono modelli predittivi che selezionino i risultati più rilevanti per quella persona rispetto al numero pressoché infinito di possibili altri risultati. Da un punto di vista astratto, si tratta di un mestiere tutt’altro che diverso. E sempre più diffuso.