Domanda all'esperto: è vero che i social network ci guardano
Dmitry Kurkin
RISPOSTE ALLA MAGGIORANZA DELLE DOMANDE USA eravamo abituati a cercare online. Nella nuova serie di materiali poniamo queste domande: brucianti, inattese o diffuse - a professionisti in vari campi.
Il flash mob da 10 anni, lanciato nei social network all'inizio dell'anno, non solo ha generato teorie cospirative che l'obiettivo della campagna era quello di raccogliere le foto degli utenti e addestrarli a riconoscere il sistema di riconoscimento facciale, ma anche a far loro riflettere su quanto sanno di noi. social network e terze parti che lavorano con loro (dalle società commerciali alle agenzie governative).
Il fatto che i giganti della tecnologia stiano raccogliendo e analizzando le cosiddette impronte digitali lasciate da miliardi di utenti ogni giorno non è un segreto per nessuno. E la consapevolezza di questo dà origine a un nuovo tipo di paura del "fratello maggiore": i social network sanno molto di noi, ma cosa succede se sanno troppo di noi? I big data possono essere utilizzati per scoprire tutte le connessioni, i gusti, le abitudini di una persona, il suo passato e il presente? E se sì, quale danno può il nostro desiderio di socializzare online, per il quale condividiamo volontariamente le informazioni su di noi, ci causano?
Abbiamo chiesto agli esperti come vengono elaborati i dati degli utenti dalle grandi aziende e quanto grande sia il pericolo di ereditare sui social network.
Liliya Zemnukhova
Ricercatrice presso il Centro per la ricerca scientifica e tecnologica presso l'Università europea di San Pietroburgo
Un'impronta digitale contiene tutti i possibili tipi di dati: testi, immagini, registrazioni audio e video, geolocalizzazione e molti metadati (ad esempio, modello di gadget, operatore mobile, sistema operativo, dinamica e durata delle visite, ecc.). E non siamo solo noi a reintegrare la nostra impronta digitale. I social network ci formano come utenti con l'aiuto di tre fonti di dati: il fatto che noi stessi ci raccontiamo di noi stessi; che altri parlano di noi; e ciò che accade più spesso a nostra insaputa. Particolarmente opaco per ultimo. Di norma, non leggiamo accordi e politiche dell'utente per la raccolta e l'utilizzo di dati personali. Abbiamo solo notato che questa "scatola nera" influenza in qualche modo la nostra esperienza utente: pubblicità mirata, suggerimenti di amici, consigli per la musica, la procedura per lanciare notizie ... Costruiamo noi stessi una piccola parte di questa esperienza, quando costruiamo manualmente il news feed, ma principalmente gli algoritmi eseguire le funzioni incorporate nei profili predefiniti. Questo è il motivo per cui non ci libereremo mai della pubblicità contestuale o dei suggerimenti intrusivi di gruppi o (non) amici. I social network come società utilizzano i dati sui loro utenti a scopi commerciali, offrendo la loro piattaforma per la vendita di contenuti mirati. E lungo la strada, continuano a raccogliere dati su di noi: ad esempio, se hai pagato per la pubblicità almeno una volta, i dati della carta bancaria e delle transazioni rimangono anche con la società. I dati possono anche essere forniti alle agenzie governative quando c'è un grande bisogno: ad esempio, Facebook collabora regolarmente con agenzie governative degli Stati Uniti, in conformità con la sua politica di trasparenza.
Oltre alla politica interna dei social network, c'è un altro dettaglio importante: gli account possono essere associati a centinaia di migliaia di altre applicazioni e funzioni. Questo, ad esempio, è stato il motivo delle grandi discussioni dello scorso anno sull'accesso di terzi ai dati degli utenti. Un importante tentativo di regolamentare la libertà degli sviluppatori è stato fatto nell'Unione europea: i Regolamenti generali sulla protezione dei dati (GDPR) sono entrati in vigore lo scorso anno. Decise di non trasferire problemi di dati, ma attirò l'attenzione degli utenti su questa domanda. Questo non ci obbliga a leggere tutti gli accordi con gli utenti, ma ci fa pensare e almeno essere più responsabili delle nostre impronte digitali e seguire le regole elementari dell'igiene digitale.
Valeria Karavaeva
data scientist presso Spiking
A volte non pensiamo a quante tracce lasciamo sul Web e quanto tempo dopo aiuta le aziende, non solo i social network, anche se i social network. I social network raccolgono dati non solo per se stessi, ma possono venderli: ne sono a conoscenza, perché ho lavorato in un'agenzia pubblicitaria e abbiamo acquistato dati da Facebook. E molto spesso noi, gli utenti, diamo il nostro consenso senza accorgercene. Le persone trascorrono metà della loro vita sui social network e danno molte informazioni su se stessi.
Ma è stato possibile raccogliere dati prima - quindi perché hai iniziato a parlare di big data solo di recente? Prima di tutto, perché la potenza di calcolo cresce e, di conseguenza, diventa più economica. Il problema principale dei big data non è come raccogliere i dati - in linea di principio, ognuno di noi oggi può raccogliere e archiviare terabyte di informazioni - ma come lavorare con loro. La maggior parte dei dati ottenuti dai social network (testo, voce, immagini, video) non sono strutturati in alcun modo, quindi senza l'apprendimento automatico i big data sono inutili. Ora, a causa del fatto che il potere e la memoria sono diventati più economici, la domanda di reti neurali e di apprendimento approfondito è aumentata - abbiamo finalmente imparato a elaborare grandi matrici di dati.
Prendiamo, per esempio, le immagini - e questi sono davvero grandi dati, possono dare molte informazioni. Ci sono milioni di immagini, ma cosa fare con loro? Quali benefici possono essere estratti da loro? Quali schemi ti fanno sapere? L'apprendimento automatico, infatti, non è così lontano. Questo non è un processo così semplice come sembra: non esiste una cosa del genere che si preme un pulsante e in una settimana ricevere calcoli completi.
Direttamente l'apprendimento automatico è preceduto da attività più complesse. Le stesse immagini devono essere prima elaborate correttamente (ad esempio, foto ritagliate e centrate, questo è importante per l'apprendimento) - questo è il primo livello, che di solito richiede molto tempo. Il secondo passo è scegliere un'architettura di rete adatta a risolvere il problema. In parole povere, costruisci dieci reti neurali diverse e danno dieci risultati diversi. Quindi è necessario valutare in qualche modo i risultati. E dopo di ciò, con alta probabilità, ritorni al primo stadio. È impossibile creare una rete universale per qualsiasi attività: la si può costruire da zero o modificare una esistente. Il riconoscimento dei volti è un compito, il riconoscimento dei gatti è un altro.
Nel processo di apprendimento automatico, partecipiamo anche, senza saperlo. Ad esempio, introducendo captcha sui siti: utilizzando captcha, reti neurali addestrate da Google per digitalizzare libri.
Dobbiamo capire che le aziende che raccolgono i big data non sono interessate ai nostri profili personali. Hanno bisogno di dati su molte persone diverse che sono interessate a qualcosa di specifico. Per quanto riguarda i servizi speciali, penso che possano raccogliere dati senza ricorrere ai social network. Penso che le nostre paure che stiamo osservando passeranno presto. Questo è il nuovo mondo: è possibile non ereditare il web, ma è difficile. È più facile non comparire sul Web.
FOTO: antonsov85 - stock.adobe.com