Beste svaret
Du kan i utgangspunktet ha en million eksempler på dataanalyse på Google, så jeg vil gi deg her noen flere «morsomme ”Analyse, som vi ikke alltid tenker på.
– Analytics for ØL (nå har jeg alles oppmerksomhet;))
Ved å implementere en «selvbetjening» for øl (alle kan helle seg litt av forskjellige typer), skjønte ikke bare anbudene at gjennomsnittsforbruket var høyere, men de har også kunnet vite hva er favorittølene. Ølanalyse kan også bidra til å vite hva som er de ølene som fortæres raskest og når (Guiness-kegs når rekorder på St.Patrick’S-dagen), for å forutse og bestille med en forbedret presisjon. På et mer «spioneringsnivå» kan du se om noen bartendere er mer «sjenerøse» når de skjenker pintes, eller om de har en tendens til å tilby mye (til seg selv eller til klienter).
– Analytics i kasinoer
Ved å spore dataene hver kasinomaskin (eller teppe) produserer, har ledere mer kunnskap om hva som brukes og hva som ikke er, hva som er mest populært og på hvilken tid på dagen, måneden eller året , hva som genererer mest fortjeneste (eller tap). Med alle disse innsiktene, kan de handle i samsvar med dem og ta passende tiltak for å rette opp eller justere noen deler av kasinoet.
Uansett, for å utføre analysen din, er det alltid bra å utstyre deg med den rette dataanalyseringsverktøy som vil lette datarengjøringsarbeidet, for en forbedret utforskning.
Hvis du ønsker å lese flere eksempler som de som er gitt ovenfor, inviterer jeg deg til å lese denne artikkelen: 5 Big Data-eksempler i ditt virkelige liv på barer, restauranter og kasinoer !
Svar
Analyse refererer til å dele en helhet i sine separate komponenter for individuell undersøkelse. Dataanalyse er en prosess for å skaffe rådata og konvertere den til informasjon som er nyttig for beslutningstaking av brukere. Data samles inn og analyseres for å svare på spørsmål, teste hypoteser eller motbevise teorier.
Statistiker John Tukey definerte dataanalyse i 1961 som: «Prosedyrer for å analysere data, teknikker for å tolke resultatene av slike prosedyrer, måter å planlegge innsamling av data for å gjøre analysen enklere, mer presis eller mer nøyaktig, og alle maskiner og resultater av (matematisk) statistikk som gjelder analysering av data. »
Det er flere faser som kan skilles, beskrevet nedenfor. Fasene er iterative, ved at tilbakemelding fra senere faser kan resultere i ytterligere arbeid i tidligere faser.
Datakrav
Dataene som er nødvendige som input til analysen er spesifisert basert på kravene til de som leder analysen eller kunder som vil bruke det ferdige produktet av analysen. Den generelle typen enhet som dataene vil bli samlet inn omtales som en eksperimentell enhet (f.eks. En person eller en befolkning). Spesifikke variabler angående en populasjon (f.eks. Alder og inntekt) kan spesifiseres og oppnås. Data kan være numeriske eller kategoriske (dvs. en tekstetikett for tall).
Datainnsamling
Data er samlet fra en rekke kilder. Kravene kan kommuniseres av analytikere til forvalterne av dataene, for eksempel informasjonsteknologipersonell i en organisasjon. Dataene kan også samles inn fra sensorer i miljøet, slik som trafikkameraer, satellitter, opptaksenheter, etc. De kan også fås gjennom intervjuer, nedlastinger fra online kilder eller lesedokumentasjon.
Databehandling
Data som innhentes først, må behandles eller organiseres for analyse. Disse kan for eksempel innebære å plassere data i rader og kolonner i et tabellformat for videre analyse, for eksempel i et regneark eller statistisk programvare.
Datarensing
Når dataene er behandlet og organisert, kan de være ufullstendige, inneholde duplikater eller inneholde feil. Behovet for datarengjøring vil oppstå fra problemer i måten data blir lagt inn og lagret. Datarensing er prosessen med å forhindre og korrigere disse feilene. Vanlige oppgaver inkluderer registrering av samsvar, identifisering av unøyaktighet av data, generell kvalitet på eksisterende data, deduplisering og kolonnesegmentering. Slike dataproblemer kan også identifiseres gjennom en rekke analytiske teknikker. For eksempel, med finansiell informasjon, kan totalene for bestemte variabler sammenlignes med separat publiserte tall som antas å være pålitelige. Uvanlige beløp over eller under forutbestemte terskler kan også gjennomgås. Det er flere typer datarengjøring som avhenger av typen data som telefonnumre, e-postadresser, arbeidsgivere etc.Kvantitative datametoder for avvikende deteksjon kan brukes til å kvitte seg med sannsynlig feil oppgitte data. Tekstdata stavekontroller kan brukes til å redusere mengden feil skrevet ord, men det er vanskeligere å se om ordene i seg selv er riktige.
Utforskende dataanalyse
Når dataene er renset, kan de analyseres. Analytikere kan bruke en rekke teknikker referert til som utforskende dataanalyse for å begynne å forstå meldingene i dataene. Utforskingsprosessen kan resultere i ytterligere datarengjøring eller ytterligere forespørsler om data, så disse aktivitetene kan være iterative. Beskrivende statistikk , som gjennomsnitt eller median, kan genereres for å forstå dataene. Datavisualisering kan også brukes til å undersøke dataene i grafisk format, for å få ytterligere innsikt i meldingene i dataene.
Modellering og algoritmer
Matematiske formler eller modeller kalt algoritmer kan brukes på dataene for å identifisere sammenhenger mellom variablene, for eksempel korrelasjon eller årsakssammenheng . Generelt sett kan modeller utvikles for å evaluere en bestemt variabel i dataene basert på andre variabler i dataene, med noe restfeil avhengig av modellens nøyaktighet (dvs. Data = Model + Error).
Kilde: Dette