Vai al contenuto


Dottor Alfred Spitzer, «Solitudine Digitale»

Dall’inizio di questo secolo gli stati del mondo occidentale “civilizzato” raccolgono i dati personali dei loro cittadini in proporzioni mai conosciute finora. Una delle fonti fondamentali di questi dati siamo noi stessi! Siamo noi che forniamo i dati, sia con il pieno consenso, sia del tutto inavvertitamente: che siano le nostre email e le nostre telefonate ad essere lette o ascoltate, le nostre abitudini d’acquisto a essere registrate (per mezzo delle tessere fedeltà), i nostri movimenti (non solo) nei luoghi pubblici a essere monitorati per mezzo di telecamere, dei nostri smartphone o del software della nostra auto, o che siano i nostri sentimenti e stati d’animo essere non solo registrati e analizzati, ma ormai anche manipolati per mezzo di Facebook o Twitter, non fa differenza.

Prima ci preoccupavamo di ciò che sapevano sul nostro conto l’Agenzia delle Entrate o la Motorizzazione Civile. Oggi vengono raccolti, memorizzati e analizzati i dati sul nostro conto da numerose aziende e dallo Stato, in proporzioni tali che la furia catalogatrice della Stasi sembra a confronto un semplice “caffè tra signore”.
Non c’è da meravigliarsi se ormai il termine Big Data ha assunto un retrogusto sgradevole.
Il motivo che si adduce per giustificare tale furia catalogatrice è l’aumento degli attacchi terroristici: per evitarli, l’intera società deve reagire con una maggior vigilanza al fine di garantire la sicurezza interna.

Big Data e Deep Learning
Non è solo la raccolta dei dati personali ad aver conosciuto una crescita esponenziale, ma anche la possibilità di una loro analisi. E’ stato solo con lo sviluppo dei più moderni programmi di elaborazione dati che si è reso possibile interpretare i dati che uno smartphone fornisce con tutti i suoi sensori (sensori per i gesti, i movimenti, la velocità, la temperatura, l’umidità eccetera), con il microfono, le videocamere e il sistema di navigazione satellitare.
Perché solo quando l’enorme massa di dati in entrata può essere anche automaticamente analizzata si ha una reale possibilità di spiare gli uomini sulla Terra.
Non c’è da meravigliarsi quindi se quasi in contemporanea all’arrivo dello smartphone siano stati fatti i necessari progressi nell’ambito dell’elaborazione dati. Tali progressi sono conosciuti con il nome di Big Data e Deep Learning.

Il concetto di Big Data è ambiguo e i suoi contorni non solo sono sfocati, ma anche in continuo mutamento. In ogni caso si tratta di quantità di dati talmente esorbitanti che non è possibile avere una visione di insieme senza l’aiuto di strumenti meccanici e per i quali non bastano più nemmeno i consueti processi di elaborazione dati digitale.
Si dice che la quantità di dati disponibili prodotti in tutto il mondo, raddoppia ogni due o tre anni, ma si dimentica che questo dipende non da ultimo dal fatto che ci sono sempre più macchine fotografiche che scattano in continuazione foto, con una definizione sempre maggiore, che la nostra comunicazione – mail, telefonate, messaggi ecc. - viene osservata e memorizzata sempre meglio, e che i sensori più disparati forniscono in maniera del tutto automatica dati per qualsiasi cosa (a partire dal meteo fino alle nostre pulsazioni), mentre prima ci limitavamo ad assistere i fenomeni naturali senza registrarli. Con Big Data s’intende senz’altro anche questo aspetto del nostro mondo tecnologizzato.

Big Data si riferisce comunque soprattutto alle possibilità di salvataggio e interpretazione dei dati in giganteschi centri dati che sorgono nelle vicinanze di corsi dei fiumi e/o di centrali elettriche, perché calcolatori e sistemi di immagazzinamento dati sviluppano un fabbisogno energetico molto elevato, non da ultimo per il raffreddamento.


Le banche dati contengono così tante informazioni che estrarre quelle rilevanti somiglia davvero all’estrazione di metalli in una miniera. Per questo la ricerca all’interno di grandi quantità di dati viene chiamata Data Mining.
Le possibili conseguenze di tutto ciò le ha scoperte a proprie spese una quindicenne americana incinta...

L’incredibile storia della ragazza incinta
La ragazza non aveva ancora informato i genitori della sua gravidanza, quando ricevette posta da un supermercato locale: pubblicità di vestiti pre-maman, fasciatoi e molti, molti visi di bebè...
Il padre, che non aveva trovato affatto divertente la cosa si recò furibondo al supermercato chiedendo di parlare con il manager: «Mia figlia ha trovato questo nella cassetta postale (...)  va ancora a scuola e voi le ha mandate coupon per vestiti da bebè e culle? Volete che mia figlia rimanga incinta
Il manager si scusò e anche dopo qualche giorno telefonò di persona per scusarsi nuovamente. Ma la voce del padre adesso suonava affranta: «ho fatto una chiacchierata a quattrocchi con mia figlia.  Ho scoperto che a casa nostra succedevano cose di cui non sapevo nulla. Partorirà ad agosto. Sono io che devo scusarmi con lei».
Cos’era accaduto?

Nei supermercati degli Stati Uniti esistono da molto tempo coupon, sconti e carte socio che hanno essenzialmente la funzione di raccogliere informazioni sul cliente: età, sesso, stato di famiglia, figli, domicilio, guadagno; le carte di credito utilizzate, le pagine web consultate sono note ai negozi tanto quanto le preferenze tra le marmellate, il caffè o i fazzoletti di carta, oppure le particolarità della dieta (vegetariana, vegana, intollerante al lattosio o al glutine, ecc.).
Se le informazioni possedute dai supermercati non sono per loro sufficienti, ne comprano altre: «sull’appartenenza etnica, sulle precedenti occupazioni, sulle riviste lette, se si è stati inadempienti o se si è separati, in che anno si è comprato casa, che scuola si è frequentata o che università, di cosa si parla o si scrive online, quali sono le posizioni politiche, ecc.»

La catena di supermercati Target, la seconda più grande negli USA, è tra le prime che provano a scoprire per mezzo del Data Mining quali delle proprie clienti siano in stato di gravidanza.
Per far ciò si confrontano gli acquisti di migliaia di donne che si sa essere incinte, con gli acquisti delle donne non incinte. Da tale confronto risulta che le donne in stato di gravidanza, a partire circa dall’inizio del loro quarto mese, comprano prodotti per la pelle senza l’aggiunta di profumi e, nei primi 5 mesi di gravidanza, acquistano integratori alimentari come calcio, magnesio e zinco.
«Sono molte le clienti che comprano saponi e ovatta, ma quando la cliente inizia all’improvviso a comprare molti saponi inodori, confezione extralarge di ovatta, lozioni per il bucato a mano e strofinacci, è probabilmente vicina alla data del parto».
In questo modo, sulla base di circa 25 prodotti acquistati da una donna, è possibile non soltanto assegnare un punteggio di previsione della gravidanza, ma anche calcolare una finestra relativamente ristretta sul giorno della nascita.

Su questa base è possibile raggiungere i clienti con pubblicità molto mirate e tanto più efficaci se si pensa che la gravidanza e la nascita di un figlio sono sempre fasi di cambiamenti radicali, in cui si definiscono alcune vecchie abitudini.
Così è successo quello che doveva succedere...
Dopo che l’incidente della ragazza quindicenne è stato reso pubblico sul «New York Times»[1], ci si è resi conto che la strategia adottata non era affatto una buona strategia di marketing. Eppure chi crede che il supermercato abbia abbandonato il suo calcolo delle previsioni di gravidanza si sbaglia.
Adesso lo fa soltanto in maniera più subdola, stampando un tosaerba accanto al pannolino sul coupon, in modo che la cosa dia meno nell’occhio: la cliente crede che tutti ricevano lo stesso coupon e considera la pubblicità dei pannolini un caso…

 

Alfred Spitzer, medico psichiatra è stato visiting professor a Harvard e attualmente dirige la Clinica psichiatrica e il Centro per le Neuroscienze e l’Apprendimento dell’Università di Ulm.
Autore di numerosi saggi tra cui «Demenza Digitale»

Note

[1] «How company learn your secrets», «New York Times», 16 febbraio 2016, https://www.nytimes.com/2012/02/19/magazine/shopping-habits.html 

Marcello Pamio

Il filoso, giurista e storico francese Charles-Louis de Secondat, noto solo come Montesquieu (1689-1755) è considerato il padre della teoria politica della separazione dei poteri.
Egli ha descritto la famosa tripartizione dei poteri: legislativo (fa le leggi), esecutivo (le mette in pratica) e giudiziario (che in teoria avrebbe il compito di farle rispettare). Questi poteri in una “democrazia” dovrebbero essere ovviamente separati e indipendenti gli uni dagli altri, ma sappiamo bene che nella realtà non è proprio così.
Qualche secolo dopo Montesquieu si sono materializzati altri due poteri: il «Quarto Potere», quello della carta stampata, e il «Quinto Potere», quello dei mezzi di comunicazione di massa (radio, televisione e oggi internet e dispositivi digitali).
Questi ultimi rappresentano lo strumento di controllo sociale e manipolazione della pubblica opinione, e coloro che li gestiscono hanno un responsabilità enorme.
Ultimamente si è aggiunto anche il «Sesto Potere», che va sotto il nome di «Big Data».

Il termine «Big Data» è stato usato per la prima volta nel 2014 e rappresenta il più occulto e paradossalmente il più subdolo e persuasivo degli altri cinque. Letteralmente significa «grandi dati», e rappresenta l’insieme delle tecnologie di analisi di enormi quantitativi di informazioni e la capacità di estrapolare, mettendo in relazione questi dati, eventuali legami e/o prevedere andamenti futuri.
Potrà sembrare fantascienza, ma qualsiasi cosa noi facciamo nella nostra vita, nella nostra quotidianità produce dati….
Nella vita virtuale, basta una ricerca su Google, un acquisto al supermercato, postare delle foto sui social, registrare un messaggio vocale, scrivere un tweet o un post, ecc.
Nella vita reale avviene la medesima cosa: quando si entra in una metropolitana l’obliteratrice traccia il nostro passaggio, come pure quando si passa per un casello autostradale o si acquista con carta di credito...
Questo enorme flusso di dati non va perduto, ma viene catturato da Big Data.
Le stime degli esperti fanno impallidire: nel 2000 tale mole di dati viaggiava a circa 1,5 miliardi di Gigabyte, mentre nel 2012 era di 650.000 petabytes.[1]

«Dall’alba della civiltà fino al 2003 l’umanità ha generato 5 exabytes (5 miliardi di gigabytes) di dati, mentre ora ne produciamo 5 exabytes ogni 2 giorni con un ritmo accelerato che raddoppia ogni 40 mesi»[2] Tali sconvolgenti previsioni però sono sbagliate in ribasso perché nel 2013 avevamo già prodotto ben 4.400 exabytes.[3]

Tutti questi dati vengono raccolti, analizzati e monetizzati: coloro che sono in grado di gestirli e interpretarli hanno un potere unico al mondo.

Data Mining
Con «Data Mining» s’intende l’insieme delle tecniche e metodologie che servono per l’estrazione di informazioni utili derivate da grandi quantità di dati. Avere infatti montagne di hard disk zeppi di fantamiliardi di informazioni non serve a nulla se non si è poi in grado di trasdurli nel concreto.
Queste tecniche sono quasi tutte automatizzate, grazie a specifici software e algoritmi. Al momento attuale vengono utilizzate reti neurali, alberi decisionali, clustering e analisi delle associazioni.
Le finalità del Data Mining possono venire applicate nei vari campi: economico, scientifico, marketing, industriale, statistico, ecc.
L’operazione parte da informazioni «criptiche», senza ordine apparente in un database e arriva a una conoscenza sfruttabile per vari fini, principalmente quello di tipo economico.

Ecco un banale esempio di utilizzo del Data Mining.

Il cliente che chiede un prestito a un istituto di credito compra abitualmente feltrini adesivi per i piedi dei mobili?
Se lo fa, le sue chance di ricevere il prestito aumentano. Il nesso, piuttosto curioso ma vero, è stato messo in luce proprio applicando strategie di Data Mining, che hanno evidenziato come chi compra feltrini tendenzialmente è un ottimo pagatore.[4]

Si tratta solo di un esempio ma dimostra come Big Data è in grado di sondare gli aspetti più intimi. Come fanno infatti a sapere che chi compra feltrini per i mobili è più affidabile di chi non li compra? Dall’altra parte come potranno essere usate queste informazioni dalle società di credito quando arriva in filiale un cliente che non ha mai comprato feltrini?
Tenuto conto che tali dati interessano la globalità dell’essere umano, per cui anche in ambito medico, come si comporteranno le assicurazioni e/o le banche, sapendo che Mario Rossi ha chiesto un mutuo o una polizza sulla vita, ma dal database risulta essere una persona geneticamente predisposta al cancro, o al morbo di Parkinson o all’Alzheimer?

Ricerca Motivazionale
La «Ricerca Motivazionale» rappresenta il fulcro centrale delle lobbies: cosa c’è infatti di più importante  che capire le vere motivazioni che stanno alla base dei comportamenti di acquisto dei consumatori? Tale “Ricerca” avviene dai primi decenni del secolo scorso, ma oggi con l’evoluzione della tecnologia, i risultati sono futuristici.
Analizzando i dati delle carte fedeltà e incrociandoli con quelli delle carte di credito, è possibile scoprire delle cose inquietanti su ognuno di noi.
I «programmi fedeltà» esistono solo per persuaderci a comprare di più. Ogni volta che usiamo tali carte, viene aggiunta al nostro archivio digitale l’indicazione di quello che abbiamo comprato, le quantità, l’ora, il giorno e il prezzo. Quando usiamo le carte di credito, l’azienda archivia la cifra e la tipologia merceologica: ad ogni transazione è assegnato un codice di quattro cifre che indica la tipologia di acquisto.
Dove vanno a finire questi dati, ora è facile immaginarlo…

Big Data & Big Pharma
Ecco come Big Pharma utilizza il Data Mining.
Le lobbies chimico-farmaceutiche spendono ogni anno miliardi in Ricerca e Sviluppo (R&D), ma ne spendono molti di più in marketing spudorato: comparaggio (corruzione), pubblicità di medicinali, e mandando negli studi medici i loro fedelissimi rappresentanti.
Questi per promuovere le loro molecole, oltre alle classiche informazioni sui farmaci e ai campioni gratuiti hanno un altro potente strumento: i report sulla storia prescrittiva del medico.
Le industrie cosa fanno? Comprano questi report da ditte specializzate (PDI, «Prescription Drug Intermediary»), che a loro volta acquisiscono i dati di prescrizione dei singoli medici dalle farmacie, collegandoli poi alle informazioni sui medici che comprano dall’AMA, «American Medical Association».[5]
Con questi sono in grado di sapere se il medico è un grande prescrittore oppure no; se adotta subito le novità consigliate e/o omaggiate; riescono ad avere maggiori strumenti per convincerlo a prescrivere il farmaco più costoso, e infine possono contrattare i propri compensi.
E’ un caso che l’industria farmaceutica rappresenta il primo consumatore dei dati di prescrizione?
Sono dati per loro fondamentali.

In Italia teoricamente questo non potrebbe avvenire perché vige il divieto alle farmacie di fornire dati, ma i dubbi rimangono sempre moltissimi, anche perché dove vanno a finire i dati dei farmaci acquistati (con o senza ricetta medica) quando il lettore del codice a barre della cassa scansiona prima i medicinali e poi il codice fiscale con la scusa di “detrarli”? Nel codice fiscale c’è il nome e cognome della persona e nella ricetta quello del medico prescrittore…
Si possono o no incrociare questi dati e avere un quadro generale della persona e del medico?

La privacy non esiste
La “privacy” esiste? No, serve solo a prendere in giro il popolo-gregge dando l’illusione che vi sia il rispetto della vita personale, ma questo rispetto non è mai esistito.
Non è certo una novità sapere che molte aziende vendono e altrettante aziende acquistano i dati personali di milioni di persone.
Chi gestisce questi dati non solo è in grado di costruire un profilo accuratissimo di ciascun individuo, ma anche di interferire molto seriamente nelle sue scelte.
Ne vediamo solo la puntina dell’iceberg quando visitando delle pagine web, subito dopo su Amazon, Google o altri siti appaiono magicamente delle pubblicità coerenti con quello che abbiamo visionato qualche istante prima. Su Amazon dei sofisticatissimi algoritmi dirigono le scelte consigliandoci addirittura i titoli di libri su argomenti che sanno ci interessano; Facebook per esempio ci suggerisce alcune precise amicizie; Booking invece ci suggerisce delle mete per noi ambite da sempre.
Come fanno? Hanno la sfera di cristallo o più semplicemente la responsabilità è solo nostra perché lasciamo in giro pezzetti di noi stessi?

“Like” e “Tweet”: il profilo psicometrico
Secondo alcuni analisti bastano pochissimi «like», i «mi piace», o qualche «tweet» per fare previsioni sul futuro comportamento di una persona.
Like e tweet rientrano nella categoria dei «rivelatori di preferenza».
Quello che non tutti sanno è che incrociando i dati è possibile arrivare a individuare gusti e caratteristiche molto più intimi e personali, che apparentemente sono disgiunti da quelli espressi con il singolo like.
La conclusione è preoccupante perché è possibile tracciare un identikit molto accurato di ogni individuo semplicemente da qualche dato lasciato nel cyberspazio: etnia, gusti alimentari, orientamento sessuale, opinioni politiche, e non solo possono essere predetti.
Pensate che con soli 70 like riescono a creare un «profilo psicometrico» che permetterebbe ai gestori di Big Data di conoscere quella persona meglio dei propri amici. Con 150 like l’analista è in grado di conoscerci meglio della nostra famiglia e con 300 like meglio del nostro partner…
La vita umana oramai è stata delegata e regalata nelle mani di spietati individui che per soldi e potere interferiscono con le nostre scelte, anche quelle più intime.

Cosa fare
Possiamo in qualche maniera tutelarci? Rinunciare ad internet non ha molto senso, almeno nella nostra società, ma almeno imparare ad usarlo correttamente per quello che è: uno strumento!
Oggi però questo strumento non viene usato dalle persone, sono le persone che vengono usate da esso.
Il mezzo è diventato il fine ultimo, e questo è assai pericoloso.
Disseminiamo l’etere ogni giorno di dati personali: acquistiamo in negozio con la carta di credito, compiliamo la scheda per la tessera fedeltà, andiamo in giro col telepass, ecc. ma quello che di noi perdiamo nel web e le tracce che lasciamo del nostro passaggio, non hanno paragoni. Ogni sito che visitiamo, video che guardiamo, articolo che leggiamo, banner che clicchiamo, oggetto che compriamo con paypal o carta di credito, per non parlare dei like o dei twitter sono tutti dati che vanno a riempire non solo Big Data, ma una cartella sempre più grande, che sopra ha l’etichetta col nostro nome e cognome...
Ora che sappiamo qualcosina in più di come funziona il Sistema, possiamo girare la testa dall’altra parte e continuare a fare quello che abbiamo sempre fatto; possiamo altrimenti decidere di usare il web (cellulare compreso, visto che lo smartphone non è più un telefono ma un computer tascabile perennemente connesso) con maggior consapevolezza e intelligenza di prima, o infine isolarci dal mondo tornando all’epoca della pietra, comunicando col piccione viaggiatore, nella speranza che qualche drone non lo intercetti...

 

[1] «Il Sesto Potere fagocita i nostri dati e li può utilizzare per controllarci», Giuseppe Arbia, «Il Giornale», 15 settembre 2018

[2] Eric Schmidt, nel 2010 era amministratore delegato di Google

[3] «Il Sesto Potere fagocita i nostri dati e li può utilizzare per controllarci», Giuseppe Arbia, «Il Giornale», 15 settembre 2018

[4] «Data Mining», http://www.intelligenzaartificiale.it/data-mining/

[5] «Limitazioni all'uso dei dati di prescrizione per la promozione dei farmaci negli USA», www.nograzie.eu