Bästa svaret
Du kan i grunden ha en miljon exempel på dataanalys på Google, så jag ger dig här lite mer ”roligt ”Analys, som vi inte alltid tänker på.
– Analytics för ÖL (nu har jag allas uppmärksamhet;))
Genom att implementera en ”självbetjäning” för öl (alla kan hälla sig lite av olika typer) insåg inte bara bardbuden att den genomsnittliga konsumtionen var högre, men de har också kunnat veta vad är favoritölen. Ölanalys kan också hjälpa till att veta vilka öl som konsumeras snabbast och när (Guiness kegs når rekord på St.Patricks dag), för att förutse och beställa med en förbättrad precision. På en mer ”spioneringsnivå” kan du se om vissa bartendrar är mer ”generösa” när de häller pintes, eller om de tenderar att erbjuda mycket (till sig själva eller till kunder).
– Analys i kasinon
Genom att spåra data som varje kasinomaskin (eller matta) producerar har chefer mer kunskap om vad som används och vad som inte är, vad som är mest populärt och vid vilken tid på dagen, månaden eller året , vad som genererar mest vinst (eller förlust). Med alla dessa insikter kan de agera i enlighet med detta och vidta lämpliga åtgärder för att rätta till eller justera vissa delar av deras casino.
Hur som helst, för att utföra din analys är det alltid bra att utrusta dig med rätt dataanalysverktyg som underlättar datarengöringsarbetet för en förbättrad utforskning.
Om du vill läsa fler exempel som de som tillhandahålls ovan uppmanar jag dig att läsa den här artikeln: 5 Big Data-exempel i ditt verkliga liv på barer, restauranger och kasinon !
Svar
Analys avser att bryta en helhet i sina separata komponenter för individuell undersökning. Dataanalys är en -process för att erhålla rådata och omvandla den till information som är användbar för användarnas beslutsfattande. Data samlas in och analyseras för att svara på frågor, testa hypoteser eller motbevisa teorier.
Statistiker John Tukey definierade dataanalys 1961 som: ”Procedurer för analys av data, tekniker för tolkning av resultaten av sådana procedurer, sätt att planera insamling av data för att göra analysen enklare, mer exakt eller mer exakt, och alla maskiner och resultat av (matematisk) statistik som gäller analys av data. ”
Det finns flera faser som kan urskiljas, beskrivna nedan. Faserna är iterativa, eftersom återkoppling från senare faser kan leda till ytterligare arbete i tidigare faser.
Datakrav
De uppgifter som krävs som input till analysen specificeras baserat på kraven från de som leder analysen eller kunder som kommer att använda analysens färdiga produkt. Den allmänna typen av enhet som uppgifterna kommer att samlas in kallas en experimentell enhet (t.ex. en person eller en befolkning av människor). Specifika variabler för en befolkning (t.ex. ålder och inkomst) kan specificeras och erhållas. Data kan vara numeriska eller kategoriska (dvs. en textetikett för siffror).
Datainsamling
Data är samlas in från olika källor. Kraven kan meddelas av analytiker till vårdnadshavare av uppgifterna, såsom personal inom informationsteknik inom en organisation. Uppgifterna kan också samlas in från sensorer i omgivningen, såsom trafikkameror, satelliter, inspelningsenheter etc. Det kan också erhållas genom intervjuer, nedladdningar från onlinekällor eller läsning av dokumentation.
Databehandling
Uppgifter som ursprungligen erhållits måste bearbetas eller organiseras för analys. Dessa kan till exempel innebära att data placeras i rader och kolumner i ett tabellformat för vidare analys, t.ex. i ett kalkylblad eller statistisk programvara.
Datarengöring
När informationen är bearbetad och organiserad kan den vara ofullständig, innehålla dubbletter eller innehålla fel. Behovet av datarengöring kommer att uppstå på grund av problem med hur data matas in och lagras. Datarengöring är processen för att förhindra och korrigera dessa fel. Vanliga uppgifter inkluderar postmatchning, identifiering av felaktigheter i data, övergripande kvalitet på befintlig data, deduplicering och kolumnsegmentering. Sådana dataproblem kan också identifieras med en mängd olika analytiska tekniker. Med finansiell information kan till exempel summan för vissa variabler jämföras med separat publicerade siffror som tros vara tillförlitliga. Ovanliga belopp över eller under förutbestämda trösklar kan också ses över. Det finns flera typer av datarengöring som beror på vilken typ av data som telefonnummer, e-postadresser, arbetsgivare etc.Kvantitativa datametoder för avvikande upptäckt kan användas för att bli av med troligtvis felaktigt angivna data. Stava-kontroller för textdata kan användas för att minska mängden felaktiga ord, men det är svårare att säga om själva orden är korrekta.
När data har rensats kan de analyseras. Analytiker kan använda en mängd olika tekniker som kallas explorativ dataanalys för att börja förstå de meddelanden som finns i datan. Utforskningsprocessen kan resultera i ytterligare datarengöring eller ytterligare begäranden om data, så dessa aktiviteter kan vara iterativa till sin natur. Beskrivande statistik som medelvärdet eller medianen kan genereras för att förstå informationen. Datavisualisering kan också användas för att undersöka data i grafiskt format för att få ytterligare insikt om meddelandena i datan.
Modellering och algoritmer
Matematiska formler eller modeller som kallas algoritmer kan tillämpas på data för att identifiera förhållanden mellan variablerna, såsom korrelation eller orsakssamband . I allmänna termer kan modeller utvecklas för att utvärdera en viss variabel i data baserat på andra variabler i data, med något kvarvarande fel beroende på modellens noggrannhet (dvs. Data = Model + Error).
Källa: Detta