Visualizzare i dati con il LinePlot o grafico a linee con Python e MatplotLib
Prerequisiti :
Se non sai perchè utilizzeremo python, clicca qui
Se non hai ancora installato Python, clicca qui
Se non sai come scaricare e gestire le librerie, clicca qui
Se non sai cosa sia un Dataset, clicca qui

Prima di iniziare la giuda pratica per creare uno linePlot partendo da un dataset vediamo quando è utile o necessario utilizzare il grafico a linee.
Cosa è lo linePlot?
Il grafico a linee rappresenta su due assi (x & y), mediante una o piu linee, coppie di dati numerici, con una variabile di coordinate ( x, y ).
Quando è consigliato usarlo?
Quando bisogna cercare quale variabile indipendente influenzi maggiormente la variabile dipendente
Quando la variabile dipendente può avere più valori per ogni valore della variabile indipendente
Quando si cerca di determinare se le due variabili sono correlate.
In alcuni casi vine anche usato per lo studio di funzioni.
Installiamo la librerie Necessarie
Per installare le librerie necessarie per la rappresentazione dei nostri dati con il LinePlot o grafico a linee apriamo il terminale e digitiamo il seguente comando:
pip install matplotlib
pip3 install matplotlib #per python3
pip install numpy
pip3 install numpy #per python3
pip install pandas
pip3 install pandas #per python3
Giuda alla visualizzazione dello LinePlot da un file Excel
Creiamo un nuovo file e importiamo le librerie che ci serviranno.
Per questo esempio utilizzeremo questo file excel
import matplotlib.pyplot as plt
import pandas as pd
Creiamo adesso con pandas il nostro dataset in memoria
Creiamo adesso con pandas il nostro dataset in memnoria
#carichiamo in Ram i dati contenuti nel file excel
dataset = pd.read_excel (r'mq_prezzo_appartamento.xlsx')
#stampiamo il nostro dataset
print(dataset)
output:
mq prezzo 0 50 37500 1 55 45375 2 60 54000 3 65 63375 4 70 73500 5 75 84375 6 80 96000 7 85 108375 8 90 121500 9 95 135375 10 100 150000 11 105 165375 12 110 181500 13 115 198375 14 120 216000 15 125 234375 16 130 253500 17 135 273375 18 140 294000 19 145 315375 20 150 337500 21 155 360375 22 160 384000 23 165 408375 24 170 433500 25 175 459375 26 180 486000 27 185 513375 28 190 541500 29 195 570375 30 200 600000 31 205 630375 32 210 661500 33 215 693375 34 220 726000 35 225 759375 36 230 793500 37 235 828375 38 240 864000
Creiamo due liste contenti rispettivamente i valori X (metri quadrati) e Y (prezzo appartamento)
#creiamo due liste conteneti rispettivamente i valori X (metri quadrati) e Y (prezzo appartamento)
mq = dataset['mq']
prezzo = dataset['prezzo']
#stampiamo le nostre liste
print(mq,prezzo)
output:
1 55
2 60
3 65
...
37 235
38 240
1 45375
2 54000
3 63375
...
37 828375
38 864000
Visti così si capisce poco e niente, ma ora vedremo come rappresentarli con un grafico a dispersione. La libreria MatplotLib offre anche la possibilità di personalizzare i nostri grafici.
#definire il titolo del grafico
plt.title("Rapporto dimensione / prezzo degli appartamenti")
#definire il testo dell'asse x
plt.xlabel("Dimensione in m^2 dell'appartamento")
#definire il testo dell'asse y
plt.ylabel("prezzo in € dell'appartamento")
#definire lo sfondo a griglia
plt.grid()
#definire le dimensioni de grafico
plt.rcParams['figure.figsize'] = [15,10] #altezza,lunghezza
#la funzione per creare il grafico è molto semplice
plt.plot(metriquadrati_appartamento,prezzi_appartamento, label="Rapporto appartamenti")
#definire la leggenda del grafico
plt.legend()
#salviamo il grafico
plt.savefig("scatterPlot_rapporto_mq_prezzo_appartamenti.png")
#mostriamo il grafico
plt.show()
output:

Scarica Gratuitamente l'esempio
Per scaricare gratuitamente devi prima registrati/accede al portale.
Scorri in fondo alla pagina per registrati o accedere
Giuda alla visualizzazione dello LinePlot da dati generati
Creiamo un nuovo file e importiamo le librerie che ci serviranno.
import matplotlib.pyplot as plt
import numpy as np
Creiamo adesso con Numpy dei dati da rappresentare
# utilizzando la funzione np.linspace(35,150) andiamo a creare una lista
# contenente 50 (size) numeri casuali da 50 a 150, i quali indicheranno la metratura quadrata
metriquadrati_appartamento = np.linspace(50,150)
# utilizzando la funzione np.power(metriquadrati_appartamento, 2)*9 andiamo a creare una lista
# contenente 50 numeri generati elevando al quadrato e moltiplicato per 15 la metratura quadrata
prezzi_appartamento = np.power(metriquadrati_appartamento, 2)*15
print(metriquadrati_appartamento,prezzi_appartamento)
Output:
[ 50. 52.04081633 54.08163265 56.12244898 58.16326531 60.20408163 62.24489796 64.28571429 66.32653061 68.36734694 70.40816327 72.44897959 ... 143.87755102 145.91836735 147.95918367 150. ] [ 37500. 40623.69845898 43872.34485631 47245.939192 50744.48146606 54367.97167847 58116.40982924 61989.79591837 ... 284647.02207414 293143.48188255 301764.88962932 310511.24531445 319382.54893794 328378.80049979 337500. ]
Visti così non si capisce poco e niente, ma ora vedremo come rappresentarli con un grafico a dispersione La libreria MatplotLib offre anche la possibilità di personalizzare i nostri grafici.
#definire il titolo del grafico
plt.title("Rapporto dimensione / prezzo degli appartamenti")
#definire il testo dell'asse x
plt.xlabel("Dimensione in m^2 dell'appartamento")
#definire il testo dell'asse y
plt.ylabel("prezzo in € dell'appartamento")
#definire lo sfondo a griglia
plt.grid()
#definire le dimensioni de grafico
plt.rcParams['figure.figsize'] = [15,10] #altezza,lunghezza
#la funzione per creare il grafico è molto semplice
plt.plot(metriquadrati_appartamento,prezzi_appartamento, label="Rapporto appartamenti")
#definire la leggenda del grafico
plt.legend()
#salviamo il grafico
plt.savefig("scatterPlot_rapporto_mq_prezzo_appartamenti.png")
#visulazziare il grafico
plt.show()
Output:

Scarica Gratuitamente l'esempio
Per scaricare gratuitamente devi prima registrati/accede al portale.
Scorri in fondo alla pagina per registrati o accedere
Grazie mille per la lettura, condividi l'articolo per sostenerci