I dati possono essere utilizzati per prendere decisioni e avere una grande influenza sulle aziende. Tuttavia, questa preziosa risorsa non è priva di inconvenienti.
In che modo le aziende possono acquisire, conservare e utilizzare i dati in modo etico? Quali sono i diritti che devono essere tutelati?
Alcune pratiche etiche devono essere seguite dal personale aziendale che si occupa della gestione dei dati. I dati sono informazioni personali di qualcuno e deve esserci un modo corretto per utilizzare i dati e mantenere la privacy.
Dopo aver ricevuto molte domande dai nostri utenti e da diverse aziende abbiamo deciso di dedicare un articolo a questo argomento.
Cos'è l'etica?
Il termine “etica” deriva dal greco antico ἦθος (êthos), cioè «carattere», «comportamento», o, meno probabilmente, da ἔθος cioè «costume», «consuetudine», «abitudine».
L'etica ci istruisce su cosa è buono e cosa è sbagliato. I filosofi hanno riflettuto a lungo su questo argomento cruciale e hanno molto da dire al riguardo. La maggior parte delle persone associa l'etica alla moralità: un senso naturale di ciò che è "buono". Come esseri umani, viviamo in una società e la società ha regole e regolamenti. Dobbiamo essere in grado di decidere cosa è giusto e cosa è sbagliato. L'etica si occupa di sentimenti, leggi e norme sociali che determinano il bene dal male. I nostri stili di vita devono essere ragionevoli e all'altezza degli standard della società.
Perché l'etica nella scienza dei dati è importante?
Oggi, la scienza dei dati ha un impatto significativo sul modo in cui le aziende vengono condotte in discipline diverse come scienze mediche, città intelligenti e trasporti. Che si tratti della protezione dei dati di identificazione personale, del pregiudizio implicito nel processo decisionale automatizzato, dell'illusione della libera scelta nella psicografia, degli impatti sociali dell'automazione o dell'apparente divorzio tra verità e fiducia nella comunicazione virtuale, i pericoli della scienza dei dati senza l'etica le considerazioni sono chiare come sempre. La necessità di concentrarsi sull'etica della scienza dei dati va oltre un bilancio di questi potenziali problemi perché le pratiche della scienza dei dati sfidano la nostra comprensione di cosa significhi essere umani.
Gli algoritmi, se implementati correttamente, offrono un enorme potenziale di bene nel mondo. Quando li impieghiamo per eseguire lavori che in precedenza richiedevano una persona, i vantaggi possono essere enormi: risparmi sui costi, scalabilità, velocità, precisione e coerenza, solo per citarne alcuni. E poiché il sistema è più preciso e affidabile di un essere umano, i risultati sono più equilibrati e meno inclini al pregiudizio sociale.
Viviamo tutti in un mondo digitale, in cui la nostra vita quotidiana dipende dalle applicazioni, gestite da aziende tecnologiche. Dobbiamo prendere un taxi, chiamiamo un Uber. Abbiamo bisogno di ordinare cibo, usiamo justeat o glovo e così via. Queste aziende hanno i nostri dati personali. Il nostro ID e-mail, numeri di telefono, indirizzo, cronologia degli acquisti, ecc. E così via. La protezione dei dati personali è quindi un aspetto importante ai giorni nostri. Forse nessun aspetto dell'etica della scienza dei dati ha ricevuto maggiore attenzione negli ultimi anni rispetto alla salvaguardia dei dati personali. Le nostre relazioni , le reti sociali ed economiche hanno subito una rivoluzione digitale, rivelando chi siamo, cosa crediamo e cosa facciamo.
Chi regola e possiede i nostri Dati?
Nel codificare parametri etici come :
il diritto all'informazione
il diritto all'opposizione
il diritto all'accesso
il diritto alla rettifica
il diritto all'oblio
questi quadri giuridici tentano di riequilibrare i rapporti di potere e influenza tra organizzazioni e individui.
Le divisioni tra pubblico e privato, individui e società, e le risorse ricche e povere di risorse vengono ridefinite mentre i dati diventano la nuova valuta dell'economia internazionale. Quali diritti possono essere assegnati con autorizzazione espressa o implicita e chi è il titolare dei dati personali?
In che misura le istituzioni governative e commerciali dovrebbero essere autorizzate a raccogliere e controllare enormi database di interazione umana?
Quanto dovrebbero essere ritenuti responsabili questi titolari del trattamento e responsabili del trattamento per la perdita o l'abuso delle nostre informazioni personali?
Etica della scienza dei dati
Analisti, data scientist e professionisti delle tecnologie dell'informazione devono preoccuparsi dell'etica della scienza dei dati. Chiunque lavori con i dati deve comprendere i fondamenti. Chiunque abbia a che fare con qualsiasi tipo di dati deve segnalare eventuali casi di furto di dati, raccolta, conservazione, utilizzo di dati non etici, ecc.
Ad esempio, dalla prima volta che un consumatore inserisce il proprio indirizzo e-mail sul tuo sito web fino al momento in cui acquista i tuoi beni, la tua organizzazione può raccogliere e conservare dati sui loro viaggi. Le persone nel team di marketing potrebbero avere a che fare con i dati. I dati della persona devono essere conservati.
I dati protetti sono stati resi pubblici su Internet in passato, causando danni alle persone le cui informazioni sono state rese disponibili. Database mal configurati, spyware, furto o pubblicazione su un forum pubblico possono causare fughe di dati. Gli individui e le organizzazioni devono utilizzare pratiche informatiche sicure, condurre frequenti controlli di sistema e adottare politiche per affrontare la sicurezza dei computer e dei dati.
Le aziende devono adottare misure di sicurezza informatica adeguate per prevenire la fuga di dati e informazioni. Questo è più importante per le banche e gli istituti finanziari che si occupano del denaro dei clienti. Le protezioni devono essere mantenute anche quando le apparecchiature vengono trasferite o smaltite, secondo le politiche.
Alcune pratiche etiche della data science
Privacy e Riservatezza dei Dati:
I data scientist sono continuamente coinvolti nella produzione, nello sviluppo e nella ricezione di informazioni. I dati relativi a clienti affiliati, clienti, lavoratori o altre parti con cui i clienti hanno un accordo di riservatezza sono spesso inclusi in questa categoria. Quindi, indipendentemente dal tipo di informazioni sensibili, è responsabilità del data scientist proteggerle.
Anche se un consumatore acconsente che la tua organizzazione raccolga, memorizzi e analizzi le proprie informazioni di identificazione personale (PII), ciò non significa che voglia che siano rese pubbliche.
Le informazioni personali identificabili includono:
numero di telefono
indirizzo
nome completo
numero di carta
così via.
Per preservare la privacy delle persone, assicurati di conservare le informazioni in un database sicuro in modo che non finiscano nelle mani sbagliate. La protezione tramite password con doppia autenticazione e la crittografia dei file sono due soluzioni per la sicurezza dei dati che aiutano a salvaguardare la privacy.
Proprietà dei dati:
Uno dei concetti importanti dell'etica nella scienza dei dati è che l'individuo ha la proprietà dei dati. La raccolta dei dati personali di qualcuno senza il loro consenso è illegale e immorale. Di conseguenza, per acquisire i dati di qualcuno è necessario il consenso.
Accordi scritti firmati, politiche sulla privacy digitale che richiedono agli utenti di accettare i termini e le condizioni di un'azienda e pop-up con caselle di controllo che consentono ai siti Web di tracciare il comportamento online degli utenti utilizzando i cookie sono tutti approcci tipici per ottenere il consenso. Per prevenire problemi etici e legali, non dare mai per scontato che un consumatore acconsenta alla raccolta dei suoi dati da parte dell'utente; chiedere sempre il permesso.
Avere buone intenzioni:
Le intenzioni di raccolta e analisi dei dati devono essere buone. I professionisti dei dati devono essere chiari su come e perché utilizzano i dati. Se un team sta raccogliendo dati sulle abitudini di spesa degli utenti, per realizzare un'app per gestire le spese, allora l'intenzione è buona.
Trasparenza:
Gli interessati hanno il diritto di sapere come intendi acquisire, conservare e utilizzare le loro informazioni personali, oltre a possederle. La trasparenza dovrebbe essere utilizzata durante l'acquisizione dei dati. È necessario creare una politica che spieghi come vengono utilizzati i cookie per tracciare l'attività dell'utente e come le informazioni raccolte vengono conservate in un database sicuro, nonché addestrare un algoritmo che offra un'esperienza online su misura. È diritto dell'utente avere accesso a queste informazioni in modo che possa scegliere se accettare o meno i cookie del proprio sito.
Alcuni esempi di vita reale:
OKCupid:
Nel 2016, Emil Kirkegaard e Julius Daugbjerg Bjerrekr della Danimarca hanno condiviso un set di dati sull'Open Science Framework che includeva informazioni su oltre 70.000 membri del servizio di incontri online OkCupid. I ricercatori hanno raccolto informazioni dal sito di OkCupid, inclusi nomi utente (ma non nomi reali), età, sesso, religione e caratteristiche della personalità, nonché le risposte alle domande che il sito pone ai nuovi membri per aiutare a scoprire potenziali corrispondenze, per costruire il loro proprio set di dati.
Le informazioni, raccolte tra novembre 2014 e marzo 2015, non sono anonime e sono piuttosto personali. L'unico motivo per cui i ricercatori non hanno condiviso le immagini degli utenti è che occuperebbe troppo spazio sul disco rigido, secondo i ricercatori.
Chiunque abbia ripetuto un nome utente da un sito all'altro o abbia utilizzato un nome che potrebbe essere ricondotto a loro, potrebbe improvvisamente essere gravemente vulnerabile. I dati sono stati raschiati e caricati in violazione delle norme etiche di base osservate dagli scienziati sociali. Interrogati su Twitter, i ricercatori hanno affermato che i dati erano già pubblici perché erano stati inviati su OkCupid.
Questo è stato un caso di comportamento non etico con i dati. Anche se i dati erano pubblici, raccoglierli e condividerli esplicitamente non era corretto.
Violazione dei dati di Robinhood:
La società americana di servizi finanziari Robinhood ha annunciato una violazione dei dati nel novembre 2021, che ha colpito oltre cinque milioni di utenti dell'app di trading. È stato utilizzato un sistema di assistenza clienti per ottenere indirizzi e-mail, nomi, numeri di telefono e altre informazioni. Secondo l'azienda, nessun numero di previdenza sociale è stato divulgato durante l'indagine. Conti bancari e carte di debito non erano inclusi.
Questo è stato un caso di furto di dati e si è verificato a causa di problemi di sicurezza nell'archiviazione dei dati. Dovrebbero essere presi provvedimenti per prevenire tali casi.
Data Science nella lotta al Covid-19:
L'analisi delle epidemie, una metodologia di data science finalizzata a guidare la risposta alle epidemie, è aumentata in risposta alla crescente complessità dei dati sulle epidemie.
Il governo sudcoreano ha utilizzato l'analisi in tempo reale per migliorare la progettazione del piano preventivo e la sorveglianza dei pazienti positivi al Covid. Incorpora i dati dei sistemi IoT e AI che sono alla base delle vere reti di città intelligenti, nonché i dati personali forniti dai pazienti confermati. Con l'uso dell'analisi dei big data, i ricercatori possono seguire i viaggi dei pazienti, identificare i loro contatti e anticipare la possibile entità dell'epidemia in un luogo specifico. Le informazioni vengono utilizzate anche per creare piani e istruzioni di prevenzione.
Questo è un esempio di come i dati vengono utilizzati per un buon scopo.
Conclusione:
L'etica della scienza dei dati è un importante argomento di discussione nel mondo di oggi. Le organizzazioni e le aziende che utilizzano i dati e implementano la scienza dei dati devono seguire una serie di etica durante la gestione dei dati. Se utilizzati in modo etico, i dati possono aiutarti a prendere decisioni migliori e fare la differenza nel mondo.
Vorrei aggiungere, più in generale, un concetto misurabile di etica potrebbe essere quello suggerito dal mio assistente personale.