Migliore risposta
In pratica puoi avere un milione di esempi di analisi dei dati su Google, quindi ti darò qui un po di più “divertimento “Analisi, a cui non pensiamo sempre.
– Analisi per BIRRA (ora ho lattenzione di tutti;))
Implementando un “self-service” per le birre (ognuno può versarsene un po di tipi diversi), i baristi non solo si sono resi conto che il consumo medio era più alto, ma hanno anche potuto sapere cosa sono le birre preferite. Lanalisi delle birre può anche aiutare a sapere quali sono le birre che vengono consumate più velocemente e quando (i barili Guiness stanno raggiungendo i record il giorno di San Patrizio), in modo da anticipare e ordinare con una maggiore precisione. A un livello più “spionistico”, puoi vedere se alcuni baristi sono più “generosi” quando versano le pinte, o se tendono ad offrire molto (a se stessi o ai clienti).
– Analisi nei casinò
Tracciando i dati che ogni macchina da casinò (o tappeto) sta producendo, i gestori hanno maggiori conoscenze su cosa viene utilizzato e cosa no, quali sono i più popolari e in quale momento della giornata, mese o anno , cosa sta generando il maggior profitto (o perdita). Con tutti questi approfondimenti, possono agire di conseguenza e prendere le misure appropriate per rettificare o adeguare alcune parti del loro casinò.
In ogni caso, per eseguire la tua analisi, è sempre bene dotarti del diritto strumenti di analisi dei dati che faciliteranno il lavoro di pulizia dei dati, per una migliore esplorazione.
Se desideri leggere altri esempi come quelli forniti sopra, ti invito a leggere questo articolo: 5 esempi di big data nella tua vita reale in bar, ristoranti e casinò !
Risposta
Lanalisi si riferisce alla scomposizione di un intero nelle sue componenti separate per un esame individuale. Lanalisi dei dati è un processo per ottenere dati grezzi e convertirli in informazioni utili per il processo decisionale da parte degli utenti. I dati vengono raccolti e analizzati per rispondere a domande, verificare ipotesi o confutare teorie.
Lo statistico John Tukey definì lanalisi dei dati nel 1961 come: “Procedure per analizzare i dati, le tecniche per interpretare i risultati di tali procedure, i modi di pianificare la raccolta dei dati per rendere la sua analisi più facile, più precisa o più accurata e tutti i macchinari e i risultati della statistica (matematica) che si applicano allanalisi dei dati. ”
Ci sono diverse fasi che possono essere distinte, descritte di seguito. Le fasi sono iterative, in quanto il feedback dalle fasi successive può comportare lavoro aggiuntivo nelle fasi precedenti.
Requisiti dei dati
I dati necessari come input per lanalisi sono specificati in base ai requisiti di coloro che dirigono lanalisi o dei clienti che utilizzeranno il prodotto finito dellanalisi. Il tipo generale di entità su cui verranno raccolti i dati è indicato come unità sperimentale (ad esempio, una persona o una popolazione di persone). È possibile specificare e ottenere variabili specifiche relative a una popolazione (ad es. Età e reddito). I dati possono essere numerici o categoriali (ovvero unetichetta di testo per i numeri).
Raccolta dati
I dati vengono raccolti da una varietà di fonti. I requisiti possono essere comunicati dagli analisti ai custodi dei dati, come il personale IT allinterno di unorganizzazione. I dati possono anche essere raccolti da sensori nellambiente, come telecamere del traffico, satelliti, dispositivi di registrazione, ecc. Possono anche essere ottenuti tramite interviste, download da fonti online o lettura di documentazione.
Elaborazione dati
I dati inizialmente ottenuti devono essere elaborati o organizzati per lanalisi. Ad esempio, questi possono comportare linserimento di dati in righe e colonne in un formato tabella per ulteriori analisi, ad esempio allinterno di un foglio di calcolo o di un software statistico.
Pulizia dei dati
Una volta elaborati e organizzati, i dati potrebbero essere incompleti, contenere duplicati o contenere errori. La necessità di pulire i dati deriverà da problemi nel modo in cui i dati vengono inseriti e archiviati. La pulizia dei dati è il processo di prevenzione e correzione di questi errori. Le attività comuni includono la corrispondenza dei record, lidentificazione dellinesattezza dei dati, la qualità complessiva dei dati esistenti, la deduplicazione e la segmentazione delle colonne. Tali problemi di dati possono anche essere identificati attraverso una varietà di tecniche analitiche. Ad esempio, con le informazioni finanziarie, i totali per determinate variabili possono essere confrontati con numeri pubblicati separatamente ritenuti affidabili. Possono essere rivisti anche importi insoliti al di sopra o al di sotto di soglie predeterminate. Esistono diversi tipi di pulizia dei dati che dipendono dal tipo di dati come numeri di telefono, indirizzi e-mail, datori di lavoro ecc.È possibile utilizzare metodi quantitativi per il rilevamento dei valori anomali per eliminare i dati probabilmente inseriti in modo errato. I correttori ortografici dei dati testuali possono essere utilizzati per ridurre la quantità di parole digitate male, ma è più difficile stabilire se le parole stesse siano corrette.
Analisi esplorativa dei dati
Una volta puliti, i dati possono essere analizzati. Gli analisti possono applicare una serie di tecniche denominate analisi esplorativa dei dati per iniziare a comprendere i messaggi contenuti nei dati. Il processo di esplorazione può comportare la pulizia dei dati aggiuntiva o ulteriori richieste di dati, quindi queste attività possono essere di natura iterativa. Statistiche descrittive come la media o la mediana possono essere generate per aiutare a comprendere i dati. La visualizzazione dei dati può essere utilizzata anche per esaminare i dati in formato grafico, per ottenere ulteriori informazioni sui messaggi allinterno dei dati.
Modellazione e algoritmi
È possibile applicare formule matematiche o modelli chiamati algoritmi i dati per identificare le relazioni tra le variabili, come correlazione o causalità . In termini generali, i modelli possono essere sviluppati per valutare una particolare variabile nei dati sulla base di altre variabili nei dati, con qualche errore residuo a seconda dellaccuratezza del modello (ad esempio, Dati = Modello + Errore).
Fonte: questo