Risultati Ricerca Intelligenza Artificiale Italia
128 risultati trovati per "data scientist"
- Che cos'è il Feature Engineering ?
delle feature si riferisce a un processo di selezione e trasformazione di variabili/funzioni nel set di dati i tuoi dati negli algoritmi di apprendimento automatico. Altrimenti, sarà difficile ottenere buone informazioni sui tuoi dati. Indagine CrowdFlower Secondo un sondaggio condotto da CrowdFlower su 80 Data Scientist, i Data Scientist passano il 60% del loro tempo a pulire e organizzare i dati.
- SQL
SQL (Structured Query Language) è un linguaggio specifico del dominio utilizzato per la gestione dei dati SQL è un po' come Hadoop in quanto gestisce i dati, tuttavia, l'archiviazione dei dati è molto diversa Le tabelle SQL e le query SQL sono fondamentali affinché ogni data scientist le conosca e si senta a Sebbene SQL non possa essere utilizzato esclusivamente per la scienza dei dati, è imperativo che uno scienziato dei dati sappia come lavorare con i dati nei sistemi di gestione dei database .
- Perchè capire questa differenza ?
Se sei interessato a una carriera lavorando con i big data e con i numeri, ci sono due percorsi che potresti prendere in considerazione: diventare un analista di dati. diventare uno scienziato di dati. Qual è la differenza tra analisti di dati e scienziati di dati? Poiché il mondo fa sempre più affidamento sui dati in molti aspetti del business, della ricerca e dell'economia , sia i data scientist che gli analisti sono richiesti con stipendi generalmente superiori alla media
- Le 4 Aree della RoadMap
Di solito, i data scientist provengono da diversi background educativi e di esperienza lavorativa, la scientist di successo. Quello che succede in un progetto di data science è che dopo aver tratto le conclusioni dall'analisi, Indipendentemente da ciò, un progetto di data science implica sempre una qualche forma di comunicazione Quindi è necessario avere capacità di comunicazione per diventare un data scientist.
- Riduzione della Dimensionalità
della dimensionalità Negli ultimi 4-5 anni, c'è stato un aumento esponenziale nell'acquisizione dei dati le organizzazioni di ricerca non solo stanno arrivando con nuove fonti, ma stanno anche catturando i dati Ad esempio: le aziende di e-commerce stanno acquisendo più dettagli sui clienti come i loro dati demografici Come data scientist, i dati che ci vengono offerti consistono anche di molte funzionalità, questo suona Implementiamo un Algoritmo di riduzione della dimensionalità sui dei dati e vediamo le differenze
- GOVERNANCE
I ruoli di governance per i team di data science e di analisi stanno diventando più comuni, perché le Stiamo assumendo per un ruolo di data scientist di governance incentrato su aspetti come l'integrità Poiché si tratta di un ruolo più recente, volevo identificare le funzioni chiave che un data scientist In Windfall, stiamo cercando data scientist con le seguenti competenze: EDA: Dimostrata esperienza di Scripting: come accennato in precedenza, i data scientist dovrebbero essere in grado di produrre le
- Python e I.A. - Eseguiamo un progetto di IA
lasciare nessun indietro, finalmente capiremo i motivi per i quali Python è il linguaggio più usato nella Data Abbiamo deciso di portare un esempio diverso dai soliti che potete trovare ovunque sul set di dati IRIS
- ASSICURAZIONI
Vediamo solo alcune possibili applicazione della Data Science nel settore assicurativo Prezzo di rischio conoscenza nell'era della decentralizzazione e di Internet, il settore assicurativo si è rivolto ai big data I data scientist delle assicurazioni combinano applicazioni analitiche, ad esempio modelli comportamentali tweet sulla salute personale o sullo stato d'animo Per maggiori dettagli sulle applicazioni di big data scientist stanno reprimendo affermazioni sospette.
- Introduzione
altri funzionano meglio per l'ingegneria del software e altri funzionano meglio per la scienza dei dati Molti programmatori oggi utilizzano linguaggi di programmazione di alto livello, compresi i data scientist
- VIAGGI & TRASPORTI
) che fa emergere i data scientist. Offerte veramente personalizzate Oggi le agenzie di viaggio utilizzano i big data per creare una visione Se la tua compagnia aerea ha investito in big data, ti offrirà opportunità di cross-selling e up-selling Efficienza migliorata Oltre ai sensori, i data scientist stanno estraendo informazioni da tutti gli angoli suo motore di ricerca come inizio, la start-up di viaggi Hopper mira a utilizzare algoritmi di big data
- Creare Grafici Dinamici e Interattivi con Python
Raccontare una storia con i dati è una funzione fondamentale per qualsiasi Data Scientist e creare visualizzazioni di dati che siano allo stesso tempo illuminanti e accattivanti può essere difficile. dei dati. Lavoreremo con il set di dati NIFTY-50 . Il set di dati è apertamente disponibile su Kaggle , ma utilizzeremo un sottoinsieme dei dati contenente
- Linguaggi di Programmazione per la Data Science
Quali sono i linguaggi più usati o richiesti nella data science ?
- Codifica etichetta
in binari: import numpy as np import pandas as pd from sklearn.preprocessing import LabelEncoder data , 'Country':['Tanzania','Kenya', 'Tanzania', 'Tanzania','Kenya']} # Creiamo il dataFrame data = pd.DataFrame(data) # creiamo il label encoder object le = LabelEncoder() data['Gender']= le.fit_transform (data['Gender']) data['Country']= le.fit_transform(data['Country']) print(data) Dati trasformati
- Passaggio 3: elaborare i dati per l'analisi
Ti consigliamo di verificare i seguenti errori comuni: Valori mancanti, forse clienti senza una data , forse avrai date che non hanno senso, come i dati registrati prima dell'inizio delle vendite Dovrai Dovrai usare la tua intuizione qui: Se un cliente non ha una data di contatto iniziale, ha senso dire che NON c'era una data di contatto iniziale? esplorativa dei dati (EDA).
- Cancellazione variabile
. # importa packages import numpy as np import pandas as pd # leggi dataset data = pd.read_csv('path /to/data') #setta threshold threshold = 0.7 # droppa colonne con i valori mancani più alti del threshold data = data[data.columns[data.isnull().mean() < threshold]] Nello snippet di codice sopra, puoi vedere come utilizzo NumPy e panda per caricare il set di dati e impostare una soglia su 0.7 . Ti consiglio di impostare il valore di soglia in base alla dimensione del tuo set di dati.


