Jaké jsou některé příklady analýzy dat?

Nejlepší odpověď

Na Googlu můžete mít v zásadě milion příkladů analýzy dat, takže vám zde poskytnu další „zábavu“ ”Analýza, na kterou ne vždy myslíme.

– Analytics pro PIVO (nyní mám pozornost každého;))

Zavedením „samoobsluhy“ pro piva (každý si může nalít trochu různých druhů) si nejen barové tendry uvědomily, že průměrná spotřeba byla vyšší, ale také mohly vědět, co jsou oblíbená piva. Analýza piva také pomůže zjistit, jaká jsou piva, která se konzumují nejrychleji a kdy (sudy Guiness dosáhnou rekordů v den svatého Patrika), aby mohly předvídat a objednávat se zvýšenou přesností. Na „špionážnější“ úrovni můžete zjistit, zda jsou někteří barmani „štědřejší“, když nalévají půllitry, nebo mají tendenci nabízet hodně (sobě nebo klientům).

– Analytics v kasinech

Sledováním údajů, které každý kasinový stroj (nebo koberec) produkuje, mají manažeři více znalostí o tom, co se používá a co ne, jaké jsou nejoblíbenější a v kterou denní dobu, měsíc nebo rok , co generuje největší zisk (nebo ztrátu). Se všemi těmito poznatky mohou podle toho jednat a přijmout příslušná opatření k opravě nebo úpravě některých částí svého kasina.

V každém případě je pro provedení vaší analýzy vždy dobré vybavit se správnými nástroje pro analýzu dat , které usnadní čištění dat pro lepší průzkum.

Pokud si chcete přečíst další příklady, jako jsou uvedené, výše, pozývám vás, abyste si přečetli tento článek: 5 příkladů velkých dat ve vašem reálném životě v barech, restauracích a kasinech !

Odpověď

Analýza označuje rozdělení celku na samostatné součásti pro individuální vyšetření. Analýza dat je proces získávání nezpracovaných dat a jejich převodu na informace užitečné pro rozhodování uživatelů. Data jsou shromažďována a analyzována za účelem zodpovězení otázek, testování hypotéz nebo vyvrácení teorií.

Statistik John Tukey definoval analýzu dat v roce 1961 jako: „Postupy pro analýzu dat, techniky interpretace výsledků těchto postupů, způsoby plánování shromažďování dat, aby byla jejich analýza snazší, přesnější nebo přesnější, a veškeré mechanismy a výsledky (matematické) statistiky, které se na analýzu dat vztahují. “

Existuje několik fází, které lze odlišit, popsaných níže. Fáze jsou iterativní, protože zpětná vazba z pozdějších fází může vést k další práci v dřívějších fázích.

Požadavky na data

Data nezbytná jako vstupy do analýzy jsou specifikována na základě požadavků těch, kteří řídí analýzu, nebo zákazníků, kteří budou používat hotový produkt analýzy. Obecný typ subjektu, na kterém budou údaje shromažďovány, se označuje jako experimentální jednotka (např. Osoba nebo populace lidí). Mohou být specifikovány a získány specifické proměnné týkající se populace (např. Věk a příjem). Data mohou být číselná nebo kategorická (tj. Textový štítek pro čísla).

Sběr dat

Data jsou shromážděny z různých zdrojů. Analytici mohou požadavky sdělit správcům údajů, například pracovníkům informačních technologií v organizaci. Data mohou být také shromažďována ze senzorů v prostředí, jako jsou dopravní kamery, satelity, záznamová zařízení atd. Lze je získat také prostřednictvím rozhovorů, stažením z online zdrojů nebo čtením dokumentace.

Zpracování údajů

Data, která byla původně získána, musí být pro analýzu zpracována nebo uspořádána. Mohou například zahrnovat umístění dat do řádků a sloupců ve formátu tabulky pro další analýzu, například v tabulce nebo statistickém softwaru.

Čištění dat

Jakmile budou data zpracována a uspořádána, mohou být neúplná, obsahovat duplikáty nebo obsahovat chyby. Potřeba čištění dat bude vycházet z problémů ve způsobu, jakým jsou data zadávána a ukládána. Čištění dat je proces prevence a opravy těchto chyb. Mezi běžné úkoly patří shoda záznamů, identifikace nepřesností dat, celková kvalita stávajících dat, deduplikace a segmentace sloupců. Tyto problémy s daty lze také identifikovat pomocí různých analytických technik. Například s finančními informacemi lze součty konkrétních proměnných porovnat s odděleně zveřejněnými čísly, která se považují za spolehlivá. Lze také zkontrolovat neobvyklé částky nad nebo pod předem stanovené prahové hodnoty. Existuje několik typů čištění dat, které závisí na typu dat, jako jsou telefonní čísla, e-mailové adresy, zaměstnavatelé atd.Kvantitativní datové metody pro detekci odlehlých hodnot lze použít k zbavení se pravděpodobně nesprávně zadaných dat. Ke snížení množství chybně napsaných slov lze použít kontrolu pravopisu textových dat, ale je těžší zjistit, zda jsou samotná slova správná.

Průzkumná analýza dat

Jakmile jsou data vyčištěna, mohou být analyzována. Analytici mohou k pochopení zpráv obsažených v datech použít různé techniky označované jako průzkumná analýza dat . Proces průzkumu může vyústit v další čištění dat nebo další požadavky na data, takže tyto aktivity mohou mít iterační povahu. Popisné statistiky , jako je průměr nebo medián, lze vygenerovat, aby údaje lépe porozuměly. Vizualizace dat lze také použít ke zkoumání dat v grafickém formátu a získání dalšího přehledu o zprávách v datech.

Modelování a algoritmy

Matematické vzorce nebo modely zvané algoritmy lze použít data k identifikaci vztahů mezi proměnnými, například korelace nebo kauzace . Obecně lze modely vyvinout k vyhodnocení konkrétní proměnné v datech na základě jiných proměnných v datech, s určitou zbytkovou chybou v závislosti na přesnosti modelu (tj. Data = Model + Chyba).

Zdroj: Toto

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *