top of page

Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

Sei sicuro di conoscere tutti i tipi di grafici ed il loro utilizzo ?

Secondo noi con questa guida sulle tecniche avanzate di visualizzazione dati espanderai di molto il tuo bagaglio di strumenti per l'analisi dei dati descrittiva o predittiva.



Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

Mentre tutti glorificano i modelli di apprendimento automatico e le intricate reti neurali, molti dimenticano l'immenso valore che si può ottenere dalla creazione di una potente visualizzazione dei dati.


E non sto parlando di visualizzazioni di base come grafici a linee e grafici a barre, ma di tecniche di Visualizzazione Dati!

Che cos'è la visualizzazione dei dati?

La visualizzazione dei dati è la rappresentazione grafica dei dati per aiutare le persone a comprendere il contesto e il significato. La visualizzazione interattiva dei dati consente alle aziende di approfondire per esplorare i dettagli, identificare modelli e valori anomali e modificare i dati elaborati e/o esclusi.


Fortunatamente o sfortunatamente esistono tantissimi tipi di tecniche per visualizzare i dati, ti cito quelle che conosco io :


Tipi di visualizzazioni di dati generali:

  • Grafici

  • Tabelle

  • Mappe

  • Infografica

  • Dashboard

  • Report

Tipi di visualizzazione dei dati specifici:

  • Grafico ad area

  • Grafico a bolle

  • Grafico a candele

  • Grafico a colonne

  • Grafico di combinazione

  • Grafico a ciambella

  • Grafico a imbuto

  • Diagramma di Gantt

  • Grafico del calibro

  • Carta geografica

  • Istogramma

  • Grafico Kagi

  • Grafico a linee

  • Grafico logaritmico

  • Grafico Marimekko

  • Diagramma di Pareto

  • Grafico a torta

  • Grafico a piramide

  • Grafico radar

  • Grafico a dispersione

  • Grafico a spline

  • Grafico in pila

  • Grafico ad albero

  • Grafico a cascata

  • e molti altri


In questo articolo, condividerò con te cinque potenti tecniche di visualizzazioni di dati che sono estremamente potenti e ben accolte dai dirigenti. Detto questo, iniziamo!


Tecniche di Visualizzazione Dati avanzate :

1. Grafico di coorte


Che cos'è un grafico di coorte?

Un grafico di coorte è uno strumento che consente di misurare le prestazioni dei diversi gruppi di utenti nel tempo. Mi riferirò in particolare ai grafici di coorte basati sul tempo, che raggruppano gli utenti per intervalli di tempo.


Di seguito è riportato un esempio di grafico di coorte:

Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

Terminologia ( Da Wikipedia ) :


Uno studio di coorte (talvolta erroneamente chiamato studio di pannello mal traducendo l'inglese panel study) è una forma di studio longitudinale (un tipo di studio osservazionale) usato nella medicina, nelle scienze sociali, scienze attuariali , ecologia e molte altri campi..


Una coorte è un gruppo di persone che condividono una caratteristica o un'esperienza in comune all'interno di un periodo definito (per esempio dalla nascita, o durante l'esposizione ad un farmaco o ad un inquinante, o in seguito alla somministrazione di un vaccino, o mentre vengono sottoposti a determinate procedure mediche).


Perciò un gruppo di persone nate in un giorno o periodo particolare, per esempio nel 1948, formano una coorte di nascita. Il gruppo di paragone può essere la popolazione generale dalla quale la coorte è tratta, oppure può essere un'altra coorte di persone ritenute avere minima o nulla esposizione alla sostanza sotto investigazione, ma per il resto simile. Alternativamente, dei sottogruppi nella coorte possono essere paragonati fra di loro.



Leggere un grafico di coorte è semplice:

  1. Ogni riga rappresenta una coorte . In questo caso, la coorte di utenti si basa sul mese di registrazione degli utenti. Ad esempio, la prima riga rappresenta gli utenti che si sono registrati a dicembre 2009 e la seconda riga rappresenta gli utenti che si sono registrati a gennaio 2010.

  2. Ogni colonna rappresenta un periodo. In questo caso, ogni periodo rappresenta un numero di mese. Ad esempio, la prima colonna rappresenta il primo mese di ogni coorte (mese 0) e la seconda colonna rappresenta il secondo mese di ogni coorte (mese 1).

  3. Ogni cella rappresenta il valore di interesse . In questo particolare grafico di coorte, stiamo confrontando la percentuale di entrate in ciascun periodo per ciascuna coorte di entrate del mese 0. Ad esempio, le entrate del secondo mese della prima coorte erano il 58% di quelle del primo mese e le entrate del terzo mese della prima coorte erano il 44% di quelle del primo mese.

Perché i grafici di coorte sono così utili

I grafici di coorte sono estremamente utili quando si valutano metriche che richiedono tempo per maturare . Ad esempio, se volessi guardare la percentuale di utenti che hanno sfornato nel 2021 rispetto al 2022, non sarebbe un confronto equo perché gli utenti nel 2021 hanno avuto più tempo per sfornare rispetto agli utenti nel 2022. Tuttavia, utilizzando un grafico di coorte, puoi confrontare lo stesso periodo per diverse coorti.


Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

Riportando il mio esempio, se dovessimo confrontare la prima coorte (2009–12) e la penultima coorte (2010–11), possiamo vedere che la percentuale di entrate è diminuita significativamente dai periodi da 0 a 1. Per la prima coorte la percentuale era del 58%, ma in quest'ultima coorte la percentuale è scesa all'8%. Ciò che questo ci dice è che i nuovi clienti spendono molto meno dopo il mese iniziale di acquisto. Possibili ragioni di ciò sono perché ci sono meno clienti abituali nelle coorti più recenti o la qualità del prodotto è diminuita nel tempo.


Un altro motivo per cui i grafici di coorte sono così potenti è che sono di natura olistica . Orizzontalmente, puoi comprendere l'intero ciclo di vita dei tuoi utenti e in quale punto del ciclo di vita il comportamento degli utenti cambia drasticamente. In verticale, puoi confrontare e valutare le prestazioni delle coorti di utenti più recenti con quelle di utenti più anziani.

Applicazioni dei grafici di coorte

Le applicazioni più comuni dei grafici di coorte sono:

  1. Valutare l'abbandono nel tempo .

  2. Valutare le entrate o la redditività.

  3. Valutare le conversioni della canalizzazione.


 


Tecniche di Visualizzazione Dati avanzate :

2. Matrice di correlazione


Ma prima, cos'è la correlazione?

La correlazione è una misura statistica da -1 a 1 che ci dice quanto sia forte la relazione lineare tra due variabili.

Se la correlazione è -1, allora c'è una perfetta correlazione negativa tra le due variabili, il che significa che un aumento di una variabile predice in modo affidabile una diminuzione dell'altra.

Se la correlazione è 1, allora c'è una perfetta correlazione positiva tra le due variabili, il che significa che un aumento di una variabile predice in modo affidabile un aumento dell'altra.

Se la correlazione è 0, allora non c'è correlazione tra le due variabili. Di seguito sono riportati alcuni esempi di diversi tipi di modelli di correlazione:

Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

Che cos'è una matrice di correlazione

Una matrice di correlazione è una tabella n per n che mostra i coefficienti di correlazione tra ciascuna variabile di riga e variabile di colonna.

Usando il grafico sottostante come esempio, possiamo vedere che se guardiamo la prima riga (acidità fissa) e la seconda colonna (acidità volatile), il coefficiente di correlazione è -0,26.

Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

Quando è utile una matrice di correlazione?

Una matrice di correlazione è utile quando si desidera ottenere una rapida comprensione delle relazioni lineari tra tutte le variabili. Ciò è particolarmente utile quando si creano modelli in diversi casi:

  • Quando si creano modelli di regressione, è possibile utilizzare una matrice di correlazione per identificare la collinearità tra le variabili.

  • Quando si creano modelli di machine learning, è possibile utilizzare una matrice di correlazione per identificare potenziali funzionalità avanzate che è possibile utilizzare per il modello.

  • Quando si esegue l'importanza delle funzionalità, è possibile utilizzare una matrice di correlazione per rimuovere le variabili correlate.



 

Tecniche di Visualizzazione Dati avanzate :

3. Displot

Che cos'è un distplot e perché sono utili?

Un distplot, abbreviazione di plot di distribuzione, è una combinazione di più rappresentazioni statistiche di dati numerici per rappresentare la variazione nella distribuzione dei dati. Un distplot può essere una combinazione di diversi grafici come istogrammi, stimatori di densità del kernel (KDE) e grafici del tappeto.

L'obiettivo principale di un distplot è comprendere e confrontare le distribuzioni dei dati per comprendere meglio le misure delle tendenze centrali, l'asimmetria dei dati e la diffusione dei dati.

Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere


 

Tecniche di Visualizzazione Dati avanzate :

4. Grafici a cascata


Che cos'è un grafico a cascata e perché sono utili?

Un grafico a cascata è un tipo unico di grafico a barre che mostra la variazione netta di un valore attraverso una serie di valori positivi e negativi. Invece di mostrare solo il valore iniziale e finale di una metrica, un grafico a cascata mostra come una metrica è passata da un valore iniziale a un valore finale.


L'obiettivo principale di un grafico a cascata è raccontare una storia di come una particolare metrica è cresciuta o diminuita attraverso una serie di sottocomponenti.

È particolarmente utile quando si scompongono le metriche di redditività: ad esempio, è possibile esaminare tutte le fonti di reddito per una determinata azienda, abbattere tutti i costi e concludere con il profitto dell'azienda (comunemente noto come conto economico) . Di seguito è riportato un esempio di grafico a cascata semplificato:

Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere


 

Tecniche di Visualizzazione Dati avanzate :

5. Grafici a imbuto [ FUNNEL ]


Che cos'è un diagramma a imbuto e perché sono utili?

I grafici a imbuto sono un tipo di visualizzazione utilizzato per mostrare i valori nelle fasi di un processo. Ad esempio, puoi utilizzare un grafico a imbuto come quello di seguito per mostrare quanti clienti arrivano a ciascuna fase, dalla visita del proprio sito Web alla ricezione di una fattura.


Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere
Tecniche di Visualizzazione Dati avanzate che tutti i data scientist dovrebbero conoscere

I grafici a imbuto sono utili per capire in che modo le unità efficienti scorrono da una fase all'altra. Con l'obiettivo di avere il maggior numero di unità dall'inizio alla fine, è importante capire dove ci sono cali significativi in ​​modo da poter identificare le aree per migliorare la canalizzazione.


Nell'esempio sopra, solo la metà degli utenti dei potenziali clienti ha richiesto un prezzo. Comprendendo questo, puoi quindi indagare sul motivo per cui il drop off è negativo. È perché non è chiaro dove richiedere il prezzo? È perché questi potenziali clienti sono ancora privi di informazioni e vogliono parlare con qualcuno prima di richiedere il prezzo? Questi sono alcuni esempi di come un grafico a imbuto o funnel può essere utilizzato in un ambiente aziendale.


Ti piacerebbe se approfondissimo ogni tecnica di Visualizzazione dati con il relativo codice python ?

  • Certo

  • No


Vuoi mettere in pratica quello che hai letto ?


Oppure segui i tutorial correlati :