Cel mai bun răspuns
Practic puteți avea un milion de exemple de analiză a datelor pe Google, așa că vă voi oferi aici câteva „distracții” ”Analiză, la care nu ne gândim întotdeauna.
– Analize pentru BEER (acum am atenția tuturor;))
Prin implementarea unui „autoservire” pentru beri (toată lumea se poate turna puțin de diferite tipuri), nu numai că ofertele de la baruri și-au dat seama că consumul mediu a fost mai mare, dar au putut, de asemenea, să știe ce sunt berile preferate. Analiza berilor poate ajuta, de asemenea, să știți care sunt berile care se consumă cel mai repede și când (butoaiele Guiness ating recorduri în ziua Sfântului Patrick), astfel încât să anticipați și să comandați cu o precizie sporită. La un nivel mai „spionaj”, puteți vedea dacă unii barmani sunt mai „generoși” atunci când toarnă pinte sau dacă au tendința de a oferi multe (pentru ei înșiși sau pentru clienți).
– Analize în cazinouri
Urmărind datele pe care le produce fiecare mașină de cazinou (sau covor), managerii au mai multe cunoștințe despre ceea ce este utilizat și ce nu, care sunt cele mai populare și în ce moment al zilei, lunii sau anului , ceea ce generează cel mai mare profit (sau pierdere). Cu toate aceste informații, aceștia pot acționa în mod corespunzător și pot lua măsurile adecvate pentru a rectifica sau regla unele părți ale cazinoului lor.
În orice caz, pentru a efectua analiza dvs., este întotdeauna bine să vă echipați cu dreptul instrumente de analiză a datelor care vor facilita activitatea de curățare a datelor, pentru o explorare îmbunătățită.
Dacă doriți să citiți mai multe exemple precum cele furnizate mai sus, vă invit să citiți acest articol: 5 exemple de date mari în viața dvs. reală la baruri, restaurante și cazinouri !
Răspuns
Analiza se referă la divizarea unui întreg în componentele sale separate pentru examinare individuală. Analiza datelor este un proces pentru obținerea datelor brute și transformarea acestora în informații utile pentru luarea deciziilor de către utilizatori. Datele sunt colectate și analizate pentru a răspunde la întrebări, a testa ipoteze sau a respinge teorii.
Statisticistul John Tukey a definit analiza datelor în 1961 ca: „Proceduri pentru analiza datelor, tehnici de interpretare a rezultatelor unor astfel de proceduri, modalități de planificare a culegerii datelor pentru a face analiza mai ușoară, mai precisă sau mai precisă și toate mecanismele și rezultatele statisticilor (matematice) care se aplică analizei datelor. ”
Există mai multe faze care pot fi distinse, descrise mai jos. Fazele sunt iterative, deoarece feedback-ul din fazele ulterioare poate duce la lucrări suplimentare în fazele anterioare.
Cerințe privind datele
Datele necesare ca intrări în analiză sunt specificate pe baza cerințelor celor care conduc analiza sau a clienților care vor utiliza produsul finit al analizei. Tipul general de entitate asupra căruia vor fi colectate datele este denumit o unitate experimentală (de exemplu, o persoană sau o populație de oameni). Variabile specifice privind o populație (de exemplu, vârstă și venit) pot fi specificate și obținute. Datele pot fi numerice sau categorice (de exemplu, o etichetă text pentru numere).
Colectarea datelor
Datele sunt colectate dintr-o varietate de surse. Cerințele pot fi comunicate de analiști custodilor datelor, cum ar fi personalul din tehnologia informației din cadrul unei organizații. Datele pot fi, de asemenea, colectate de la senzorii din mediu, cum ar fi camerele de trafic, sateliții, dispozitivele de înregistrare etc. De asemenea, pot fi obținute prin interviuri, descărcări din surse online sau citirea documentației.
Prelucrarea datelor
Datele obținute inițial trebuie procesate sau organizate pentru analiză. De exemplu, acestea pot implica plasarea datelor în rânduri și coloane într-un format de tabel pentru analize suplimentare, cum ar fi într-o foaie de calcul sau un software statistic.
Curățarea datelor
Odată procesate și organizate, datele pot fi incomplete, pot conține duplicate sau pot conține erori. Necesitatea curățării datelor va apărea din probleme legate de modul în care datele sunt introduse și stocate. Curățarea datelor este procesul de prevenire și corectare a acestor erori. Sarcinile obișnuite includ potrivirea înregistrărilor, identificarea inexactității datelor, calitatea generală a datelor existente, deduplicarea și segmentarea coloanelor. Aceste probleme de date pot fi, de asemenea, identificate printr-o varietate de tehnici analitice. De exemplu, cu informațiile financiare, totalurile pentru anumite variabile pot fi comparate cu numerele publicate separat, considerate a fi fiabile. Sumele neobișnuite peste sau sub pragurile predeterminate pot fi, de asemenea, revizuite. Există mai multe tipuri de curățare a datelor care depind de tipul de date, cum ar fi numerele de telefon, adresele de e-mail, angajatorii etc.Metodele cantitative de date pentru detectarea anterioară pot fi utilizate pentru a scăpa de datele introduse probabil incorect. Verificatoarele ortografice de date textuale pot fi utilizate pentru a reduce cantitatea de cuvinte greșite de text, dar este mai greu de spus dacă cuvintele în sine sunt corecte.
Analiza datelor exploratorii
Odată ce datele sunt curățate, acestea pot fi analizate. Analiștii pot aplica o varietate de tehnici denumite analiză de date exploratorii pentru a începe să înțeleagă mesajele conținute în date. Procesul de explorare poate duce la curățarea suplimentară a datelor sau solicitări suplimentare de date, astfel încât aceste activități pot fi de natură iterativă. Pot fi generate statistici descriptive , cum ar fi media sau mediana, pentru a ajuta la înțelegerea datelor. Vizualizarea datelor poate fi, de asemenea, utilizată pentru a examina datele în format grafic, pentru a obține informații suplimentare cu privire la mesajele din cadrul datelor.
Modelare și algoritmi
Formule matematice sau modele numite algoritmi pot fi aplicate datele pentru a identifica relațiile dintre variabile, cum ar fi corelație sau cauzalitate . În termeni generali, modelele pot fi dezvoltate pentru a evalua o anumită variabilă din date pe baza altor variabile din date, cu o anumită eroare reziduală în funcție de precizia modelului (de exemplu, Date = Model + Eroare).
Sursă: Aceasta