Importare file excel, csv e html con Python e Pandas

Aggiornato il: gen 7


Prerequisiti :


Vediamo adesso come è possibile importare un dataset per successivamente farci delle analisi o creare modelli predittivi grazie alla libreria di Python : Pandas

Prima di iniziare in questo articolo diamo per scontato che i dati siano già ordinati. Cosa significa? Che i dati siano strutturati, infatti utilizzeremo pandas per importare dati da fogli Excel, Csv & HTML




Installiamo le librerie

Per installare le librerie necessarie per la rappresentazione apriamo il terminale e digitiamo il seguenti comandi:


pip install pandas
pip3 install pandas #per python3

e premiamo invio.

Creiamo un nuovo file Python e importiamo la libreria scaricata.

import pandas as pd

Importare un file excel con python

Per importare file Excel esiste un apposita funzione " read_excel() ".

Vediamo qualche esempio

#stampare i dati
pd.read_excel("il_tuo_file.xls", sheet_name="Sheet1") 

#salvare i dati dentro una variabile
xlsx = pd.read_excel("il_tuo_file.xls", sheet_name="Sheet1") 

#filtrare e salvare solo alcune colonne dentro una variabile
#in questo caso verranno selezionate la colonna A e le colonne dalla C alla E
xlsx = pd.read_excel("il_tuo_file.xls",'Sheet1', usecols='A,C:E')

#salvare più fogli 
with pd.ExcelFile("il_tuo_file.xls") as xls:
    xlsx1 = pd.read_excel(xls, 'Sheet1')
    xlsx2 = pd.read_excel(xls, 'Sheet2')

Ed ecco il nostro DataFrame pronto da analizzare in pochi click. Questa è la magia di Python e delle sue librerie. Grandi risultati con qualche linea di codice.


Importare un file csv con python

Per importare file Csv o di testo esiste un apposita funzione " read_csv() ".

Vediamo qualche esempio

#stampare i dati
pd.read_csv("il_tuo_file.csv")

#salvare i dati dentro una variabile
dataset = pd.read_csv("il_tuo_file.csv")

#filtrare e salvare i dati dentro una variabile
#in questo caso verranno scartate tutte le righe contenti valori numerici dispari
dataset = pd.read_csv("il_tuo_file.csv",skiprows=lambda x:x%2!=0)

#saltare valori vuoti e salvare i dati dentro una variabile
dataset = pd.read_csv("il_tuo_file.csv",skip_blank_lines=True)

Ed ecco il nostro DataFrame pronto da analizzare in pochi click. Questa è la magia di Python e delle sue librerie. Grandi risultati con qualche linea di codice.


Importare un file html con python

Per importare file html esiste un apposita funzione " read_html() ".

Il terzo metodo che descriverò in questo articolo è come prendere le tabelle che troviamo sul web, come su wikipedia. Spesso questa funzione è molto comoda, sulla rete si trovano informazioni davvero utili.

Questo link è la pagina di wikipedia sui presidenti degli stati uniti e appena la apriamo ci accorgiamo che è composta da diverse tabelle molto ben fatte.

Vediamo qualche esempio

url = "https://en.wikipedia.org/wiki/List_of_Presidents_of_the_United_States"
    
#stampare i dati
pd.read_html(url) 

#salvare i dati dentro una variabile
tabella = pd.read_html(url) 

#filtrare e salvare i dati dentro una variabile
#in questo caso verranno scartate tutte le righe che non corrispondono al match
match = 'Barack Obama'
tabella = pd.read_html(url, match=match)

#saltare valori e salvare i dati dentro una variabile
tabella = pd.read_html(url, skiprows=range(2))

Ed ecco il nostro DataFrame pronto da analizzare in pochi click. Questa è la magia di Python e delle sue librerie. Grandi risultati con qualche linea di codice.


Registrati al portale con facebook,Google o email e diventa un membro per scaricare il file di esempio


Scarica gratis il codice contenente le funzioni per importare file Excel, Csv & HTML


Grazie mille per la lettura, condividi l'articolo per sostenerci

4,443 visualizzazioni1 commento

Post recenti

Mostra tutti

VUOI SCRIVERE ARTICOLI PER NOI.

Se vuoi scrivere articoli sul mondo dell' AI ed avere la tua visibilità, contattaci adesso.
Grazie per l'interesse dimostrato.

VUOI DIVENTARE UN MEMBRO UFFICIALE DELLA NOSTRA COMMUNITY E TRARNE I SEGUENTI BENEFICI?

Forum

Accedi al forum e fai domande o crea discussioni con esperti del settore. Potrai anche fare proposte di lavoro, condividere i tuoi progetti ed altro

Sfide

Accedi a diverse e diverti sfide sulla programmazione e intelligenza artificiale. Appena completerai la sfida riverai la certificazione

Download

Potrai scaricare in modo gratuito tutti i file dei vari progetti nel portale. Ogni progetto è disponibile in formato PDF, PYTHON, NOTEBOOK

E molto altro

Appena ti sarai registrato ti arriverà un e-book in regalo e in futuro ne riceverai altri...

In oltre potresti ricevere sconti o buoni

Se ti piacciono i benefici, i regali e vuoi essere aggiornato quando escono nuovi articoli, progetti o news premi il tasto qui sotto e registrati/accedi con Google, Facebook o con la tua email

Se invece preferisci solo sapere quando esce un nuovo articolo Senza ricevere i privilegi nel portale sopra descritti iscriviti qui sotto alla news letter

Rimani aggiornato, tranquillo anche noi odiamo lo SPAM

Segui i nostri canali social

Segui i nostri canali social 

  • YouTube Icona sociale

Youtube

  • Instagram

Instagram

  • Spotify Icona sociale

Spotify

  • White Facebook Icon

Facebook

  • Twitter Icon sociale

Twitter

©2020 Intelligenza Artificiale Italia

  • Instagram
  • Facebook Icona sociale
  • Youtube