Najlepsza odpowiedź
Zasadniczo możesz mieć milion przykładów analizy danych w Google, więc podam więcej „zabawy ”Analiza, o której nie zawsze myślimy.
– Analityka dla PIWA (teraz zwracam uwagę wszystkich;))
Wdrażając „samoobsługę” dla piwa (każdy może sobie nalać trochę innego rodzaju), nie tylko barmani zdali sobie sprawę, że średnie spożycie jest wyższe, ale także mogli wiedzieć, co to ulubione piwa. Analiza piwa może również pomóc w ustaleniu, które piwa są spożywane najszybciej i kiedy (beczki Guinnessa osiągają rekordy w dniu Świętego Patryka), aby móc przewidywać i zamawiać z większą precyzją. Na poziomie bardziej „szpiegowskim” możesz zobaczyć, czy niektórzy barmani są bardziej „hojni”, gdy nalewają piwa, czy też oferują dużo (sobie lub klientom).
– Analityka w kasynach
Śledząc dane, które produkuje każda maszyna (lub dywan) w kasynie, menedżerowie mają większą wiedzę na temat tego, co jest używane, a co nie, jakie są najpopularniejsze i o której porze dnia, miesiąca lub roku , co generuje największy zysk (lub stratę). Mając wszystkie te spostrzeżenia, mogą odpowiednio działać i podjąć odpowiednie kroki w celu naprawienia lub dostosowania niektórych części swojego kasyna.
W każdym przypadku, aby przeprowadzić analizę, zawsze dobrze jest wyposażyć się w odpowiednie narzędzia do analizy danych , które ułatwią czyszczenie danych, dla lepszej eksploracji.
Jeśli chcesz przeczytać więcej przykładów, takich jak te podane powyżej, zapraszam do przeczytania tego artykułu: 5 przykładów Big Data w prawdziwym życiu w barach, restauracjach i kasynach !
Odpowiedź
Analiza oznacza rozbicie całości na oddzielne składniki w celu indywidualnego zbadania. Analiza danych to proces służący do uzyskiwania surowych danych i przekształcania ich w informacje przydatne w podejmowaniu decyzji przez użytkowników. Dane są gromadzone i analizowane w celu udzielenia odpowiedzi na pytania, przetestowania hipotez lub obalenia teorii.
Statystyk John Tukey zdefiniował analizę danych w 1961 r. Jako: „Procedury analizowania danych, technik interpretacji wyników takich procedur, sposobów planowania gromadzenia danych, aby ich analiza była łatwiejsza, dokładniejsza lub dokładniejsza, a także cały mechanizm i wyniki statystyk (matematycznych), które mają zastosowanie do analizy danych. ”
Istnieje kilka faz, które można wyróżnić, opisanych poniżej. Fazy są iteracyjne, ponieważ informacje zwrotne z późniejszych faz mogą skutkować dodatkową pracą we wcześniejszych fazach.
Wymagania dotyczące danych
Dane niezbędne jako dane wejściowe do analizy są określane na podstawie wymagań osób kierujących analizą lub klientów, którzy będą korzystać z gotowego produktu analizy. Ogólny typ podmiotu, na temat którego będą gromadzone dane, określa się jako jednostkę eksperymentalną (np. Osoba lub populacja osób). Można określić i otrzymać określone zmienne dotyczące populacji (np. Wiek i dochód). Dane mogą być liczbowe lub kategorialne (tj. Etykiety tekstowe dla liczb).
Zbieranie danych
Dane są zebrane z różnych źródeł. Wymagania mogą być przekazywane przez analityków do osób przechowujących dane, takich jak personel informatyczny w organizacji. Dane mogą być również zbierane z czujników w środowisku, takich jak kamery drogowe, satelity, urządzenia rejestrujące itp. Można je również uzyskać poprzez wywiady, pobieranie ze źródeł internetowych lub czytanie dokumentacji.
Przetwarzanie danych
Początkowo uzyskane dane muszą zostać przetworzone lub zorganizowane do analizy. Na przykład może to obejmować umieszczanie danych w wierszach i kolumnach w formacie tabeli w celu dalszej analizy, na przykład w arkuszu kalkulacyjnym lub oprogramowaniu statystycznym.
Czyszczenie danych
Przetworzone i uporządkowane dane mogą być niekompletne, zawierać duplikaty lub zawierać błędy. Potrzeba czyszczenia danych wyniknie z problemów w sposobie ich wprowadzania i przechowywania. Czyszczenie danych to proces zapobiegania i korygowania tych błędów. Typowe zadania obejmują dopasowywanie rekordów, identyfikację niedokładności danych, ogólną jakość istniejących danych, deduplikację i segmentację kolumn. Takie problemy z danymi można również zidentyfikować za pomocą różnych technik analitycznych. Na przykład, w przypadku informacji finansowych, sumy poszczególnych zmiennych można porównać z oddzielnie publikowanymi liczbami, które uważa się za wiarygodne, a także mogą zostać poddane przeglądowi kwoty nietypowe powyżej lub poniżej z góry określonych progów. Istnieje kilka rodzajów czyszczenia danych, które zależą od typu danych, takich jak numery telefonów, adresy e-mail, pracodawcy itp.Metody danych ilościowych do wykrywania wartości odstających można wykorzystać do pozbycia się prawdopodobnie nieprawidłowo wprowadzonych danych. W celu zmniejszenia liczby błędnie wpisanych słów można użyć narzędzi sprawdzania pisowni danych tekstowych, ale trudniej jest stwierdzić, czy same słowa są poprawne.
Eksploracyjna analiza danych
Po wyczyszczeniu danych można je przeanalizować. Analitycy mogą zastosować różne techniki zwane eksploracyjną analizą danych , aby rozpocząć rozumienie komunikatów zawartych w danych. Proces eksploracji może skutkować dodatkowym czyszczeniem danych lub dodatkowymi żądaniami danych, więc działania te mogą mieć charakter iteracyjny. Aby ułatwić zrozumienie danych, można wygenerować statystyki opisowe , takie jak średnia lub mediana. Wizualizacja danych może być również wykorzystana do analizy danych w formacie graficznym, aby uzyskać dodatkowy wgląd w komunikaty w danych.
Modelowanie i algorytmy
Wzory matematyczne lub modele zwane algorytmami można zastosować do dane umożliwiające identyfikację związków między zmiennymi, takie jak korelacja lub związek przyczynowy . Ogólnie rzecz biorąc, modele można opracować w celu oceny określonej zmiennej w danych na podstawie innych zmiennych w danych, z pewnym błędem resztowym zależnym od dokładności modelu (tj. Dane = model + błąd).
Źródło: To