LinkedIn ha fatto affidamento sul suo accordo con gli utenti per ottenere il consenso alla ricerca di milioni di utenti.
Questo mese, i ricercatori di LinkedIn hanno rivelato su Science che l’azienda ha trascorso cinque anni a fare ricerche in silenzio su oltre 20 milioni di utenti.
Modificando l’algoritmo della piattaforma di networking professionale, i ricercatori stavano cercando di determinare tramite test A/B se gli utenti si ritrovano con più opportunità di lavoro quando entrano in contatto con conoscenti noti o perfetti sconosciuti.
Per valutare la forza delle connessioni tra utenti deboli o forti, conoscenti o estranei, i ricercatori hanno analizzato fattori come il numero di messaggi che hanno inviato avanti e indietro o il numero di amici comuni che hanno condiviso.
Misurando come questi fattori sono cambiati nel tempo dopo la connessione su la piattaforma dei social media. La scoperta dei ricercatori ha confermato quella che descrivono nello studio come “una delle teorie sociali più influenti del secolo scorso” sulla mobilità del lavoro.
Più deboli sono i legami degli utenti, migliore è la mobilità del lavoro. Mentre LinkedIn afferma che questi risultati porteranno a modifiche nell’algoritmo per raccomandare connessioni più rilevanti ai cercatori di lavoro come “Persone che potresti conoscere”, detto PYMK.
Il New York Times ha riferito che gli esperti di etica hanno affermato che lo studio “ha sollevato domande sulla trasparenza del settore e la supervisione della ricerca”.
Tra le maggiori preoccupazioni degli esperti c’era che nessuno dei milioni di utenti analizzati da LinkedIn fosse stato direttamente informato della partecipazione allo studio, il che “potrebbe aver influito sui mezzi di sussistenza di alcune persone”, suggerisce il rapporto del NYT.
Michael Zimmer, professore associato di informatica e direttore del Center for Data, Ethics, and Society della Marquette University, ha detto al NYT che “i risultati suggeriscono che alcuni utenti hanno avuto un migliore accesso alle opportunità di lavoro o una differenza significativa nell’accesso al lavoro opportunità.”
LinkedIn chiarisce i problemi di test A/B
Un portavoce di LinkedIn ha detto che la società contesta questa caratterizzazione della loro ricerca, affermando che nessuno è stato svantaggiato dagli esperimenti.
Da quando il NYT ha pubblicato il suo rapporto, il portavoce di LinkedIn ha detto che la società ha risposto a domande riguardo “molta rappresentazione imprecisa della metodologia” del suo studio.
Il coautore dello studio e scienziato dei dati di LinkedIn, Karthik Rajkumar, ha detto che rapporti come quelli del NYT confondono “il test A/B e la natura di osservazione dei dati”, facendola “sembrare più come una sperimentazione sulle persone, il che è impreciso”.
Rajkumar ha affermato che lo studio è nato perché LinkedIn ha notato che l’algoritmo stava già raccomandando un numero maggiore di connessioni con legami più deboli ad alcuni utenti e un numero maggiore di legami più forti ad altri.
“Il nostro test A/B di PYMK aveva lo scopo di migliorare la pertinenza delle raccomandazioni di connessione e non di studiare i risultati del lavoro”, ha detto Rajkumar ad Ars. Invece, l’obiettivo del suo team era scoprire “quali connessioni contano di più per accedere e proteggere i lavori”.
Sebbene si chiami “test A/B”, suggerendo che stia confrontando due opzioni, i ricercatori non hanno solo esaminato i legami deboli contro i legami forti, testando esclusivamente una coppia di algoritmi che hanno generato entrambi.
Piuttosto, lo studio ha sperimentato sette diverse “varianti di trattamento” dell’algoritmo, osservando che varianti diverse hanno prodotto risultati diversi, come utenti che formano meno legami deboli, creano più legami, creano meno legami o realizzano lo stesso numero di legami deboli o forti.
Due varianti, ad esempio, hanno portato gli utenti a formare più legami in generale, inclusi quelli più deboli, mentre un’altra variante ha portato gli utenti a formare meno legami in generale, inclusi meno legami deboli. Una variante ha portato a più pareggi, ma solo forti.
“Non modifichiamo casualmente la proporzione di contatti deboli e forti suggeriti da PYMK”, ha detto un portavoce di LinkedIn.
“Ci sforziamo di fornire raccomandazioni migliori alle persone e alcuni algoritmi raccomandano legami più deboli di altri. Poiché alcune persone finiscono per ottenere gli algoritmi migliori una o due settimane prima rispetto ad altri durante il periodo di test.”
Ha poi aggiunto “questo crea una variazione sufficiente nei dati per noi applicare i metodi causali osservazionali per analizzarli. Nessuno viene sperimentato per osservare i risultati del lavoro”.
Restano le questioni etiche
Un esperto di etica della ricerca per la Grossman School of Medicine della New York University, Arthur Caplan ha detto che il problema non riguarda i test A/B di LinkedIn, ma l’etica aziendale.
Sebbene lo studio sia interessante, è un altro esempio di una grande piattaforma sociale che non ottiene il consenso informato dagli utenti prima di sperimentarli.
“La loro scoperta è interessante; è utile”, ha detto Caplan. “Non è che sto cercando di dire che è una cattiva applicazione della scienza dei dati. Sto solo cercando di dire che è stato fatto senza un’etica appropriata per quella scienza dei dati”.
Secondo Caplan, quando i social network chiedono agli utenti il consenso generale per partecipare alla ricerca accettando le loro politiche per gli utenti, come ha fatto LinkedIn per questo studio, mette la ricerca in un’area legale potenzialmente grigia in cui un utente potrebbe citare in giudizio e cercare di convincere un tribunale che non capiva come venivano utilizzate le sue informazioni.
Sebbene sembri improbabile che questo studio si traduca in azioni legali, per le persone in cerca di lavoro che potrebbero aver voluto rinunciare, ad esempio, se gli fosse stato detto direttamente che potrebbero occasionalmente avere un feed con meno opportunità di lavoro acconsentendo, Caplan ha affermato che LinkedIn non fornisce opportunità e non chiarisce mai all’utente in che modo la sua ricerca potrebbe avere un impatto su di loro.
Caplan ha affermato che una potenziale soluzione potrebbe essere una finestra pop-up che avverte gli utenti quando è in corso la ricerca e come verranno utilizzati i loro dati. Un altro potrebbe essere quello di seguire le orme della società di dati sugli antenati 23andMe.
Invece di seppellire le informazioni sugli utenti che acconsentono alla ricerca in un accordo utente che poche persone leggono, LinkedIn potrebbe ottenere direttamente dagli utenti il consenso generale su questo punto specifico al momento della registrazione, sottolineando che stanno acconsentendo a questo potenziale utilizzo dei loro dati in modo che il l’azienda può confermare che tutti gli utenti sono a conoscenza.
Per Caplan, è una questione di quanto siano trasparenti le aziende nella ricerca degli utenti. “Sto dicendo che: qualcuno che cercava disperatamente un lavoro ed era nel mezzo di un esperimento per scoprire come contano le connessioni avrebbe potuto dire: ‘Non voglio farlo'”, ha suggerito Caplan.
Il modo in cui le aziende raccolgono i dati per la ricerca è un’area della politica su cui Caplan ha affermato che le autorità di regolamentazione devono ancora concentrarsi. Invece, sono più interessati al modo in cui le aziende raccolgono e vendono i dati.
Caplan ha detto che è una preoccupazione per la privacy altrettanto grande del mercato dei dati sulla posizione, perché la tua identità potrebbe essere rivelata altrettanto facilmente attraverso una violazione dei dati di ricerca.
Nelle impostazioni di ricerca, con qualsiasi informazione “qualcuno potrebbe risalire a te richiedendo un consenso diverso, un consenso esplicito e una chiara comprensione da parte della persona a cui viene chiesto di partecipare a un esperimento”, ha detto Caplan.
Per quanto riguarda la ricerca aziendale come lo studio di LinkedIn, Caplan ha anche affermato che si dovrebbe fare affidamento su un comitato di revisione etica indipendente o su un comitato di revisione istituzionale per analizzare ulteriormente eventuali danni.
Nello studio di LinkedIn, l’esperto di etica, Zimmer, ha detto al NYT che ci sono “conseguenze a lungo termine che devono essere contemplate quando pensiamo all’etica di impegnarsi in questo tipo di ricerca sui big data“.
Lo studio di LinkedIn è stato approvato dall’Institutional Review Board del Massachusetts Institute of Technology, come indicato nei suoi ringraziamenti. LinkedIn ha detto al NYT che “la ricerca non ha avvantaggiato in modo sproporzionato alcuni utenti”, ritenendo la sua metodologia “non invasiva”.
Anche tra i critici, i risultati dello studio di LinkedIn stanno generando risposte positive da parte di esperti che concordano con gli autori sul fatto che lo studio sia significativo come la “prima prova sperimentale su larga scala, longitudinale” che il networking con persone che hanno legami più deboli può migliorare la mobilità del lavoro.
Questo perché tali “conoscenze a distanza”, come le chiama lo studio, “forniscono più informazioni nuove che legami forti”, portando a “nuove opportunità di lavoro, promozioni e maggiori aumenti salariali, creatività, innovazione, produttività e prestazioni. “
Caplan afferma che la pratica di LinkedIn di divulgare le pratiche di ricerca negli accordi con gli utenti è comune con i servizi online e i ricercatori affermano che le politiche di LinkedIn sono sufficientemente trasparenti per i loro scopi.
“In ogni momento durante questo studio, abbiamo agito in modo coerente con il nostro accordo con gli utenti, la politica sulla privacy e le impostazioni dei membri”, afferma Rajkumar.
“In nessun momento miravamo a scoprire ulteriori informazioni sui singoli membri; invece, il nostro obiettivo era sempre quello di individuare l’esperienza più vantaggiosa di People You May Know che potevamo offrire a tutti i nostri membri. Siamo trasparenti con i nostri membri attraverso la nostra sezione di ricerca del nostro contratto d’uso.”