Bedste svar
Du kan stort set have en million eksempler på dataanalyse på Google, så jeg vil give dig her nogle mere “sjove ”Analyse, som vi ikke altid tænker på.
– Analytics til ØL (nu har jeg alles opmærksomhed;))
Ved at implementere en “selvbetjening” til øl (alle kan hælde sig lidt af forskellige typer), indså ikke barudbuddene, at det gennemsnitlige forbrug var højere, men de har også været i stand til at vide, hvad er de yndlingsøl. Ølanalyser kan også hjælpe med at vide, hvad der er de øl, der indtages hurtigst, og hvornår (Guiness kegs når op på St.Patricks dag) for at forudse og bestille med en forbedret præcision. På et mere “spioneringsniveau” kan du se, om nogle bartendere er mere “generøse”, når de hælder pintes, eller om de har tendens til at tilbyde meget (til sig selv eller til klienter).
– Analytics i kasinoer
Ved at spore de data, som hver casino-maskine (eller tæppe) producerer, har ledere mere viden om, hvad der bruges, og hvad der ikke er, hvad der er mest populært og på hvilket tidspunkt af dagen, måneden eller året , hvad der genererer mest fortjeneste (eller tab). Med alle disse indsigter kan de handle i overensstemmelse hermed og træffe de passende foranstaltninger for at rette eller justere nogle dele af deres casino.
Under alle omstændigheder er det altid godt at udstyre dig med det rigtige for at udføre din analyse dataanalyseværktøjer , der letter datarengøringsarbejdet til en forbedret udforskning.
Hvis du ønsker at læse flere eksempler som dem, der er angivet ovenfor opfordrer jeg dig til at læse denne artikel: 5 Big Data-eksempler i dit virkelige liv på barer, restauranter og kasinoer !
Svar
Analyse henviser til opdeling af en helhed i dens separate komponenter til individuel undersøgelse. Dataanalyse er en proces til opnåelse af rådata og konvertering til information, der er nyttig til beslutningstagning af brugerne. Data indsamles og analyseres for at besvare spørgsmål, teste hypoteser eller afkræfte teorier.
Statistiker John Tukey definerede dataanalyse i 1961 som: “Procedurer til analyse af data, teknikker til fortolkning af resultaterne af sådanne procedurer, måder til planlægning af dataindsamling for at gøre analysen nemmere, mere præcis eller mere nøjagtig og alle maskiner og resultater af (matematiske) statistikker, der gælder for analyse af data. ”
Der er flere faser, der kan skelnes, beskrevet nedenfor. Faserne er iterative, idet feedback fra senere faser kan resultere i yderligere arbejde i tidligere faser.
Datakrav
De nødvendige data som input til analysen er specificeret baseret på kravene fra dem, der leder analysen, eller kunder, der vil bruge det færdige produkt af analysen. Den generelle type enhed, som dataene indsamles på, kaldes en eksperimentel enhed (f.eks. En person eller en befolkning). Specifikke variabler vedrørende en befolkning (f.eks. Alder og indkomst) kan specificeres og opnås. Data kan være numeriske eller kategoriske (dvs. en tekstetiket til tal).
Dataindsamling
Data er indsamlet fra en række kilder. Kravene kan meddeles af analytikere til opbevarere af dataene, såsom informationsteknologipersonale i en organisation. Dataene kan også indsamles fra sensorer i miljøet, såsom trafikkameraer, satellitter, optageenheder osv. Det kan også opnås gennem interviews, downloads fra online kilder eller læsning af dokumentation.
Databehandling
De oprindeligt opnåede data skal behandles eller organiseres til analyse. For eksempel kan disse involvere placering af data i rækker og kolonner i et tabelformat til yderligere analyse, såsom i et regneark eller statistisk software.
Datarensning
Når dataene er behandlet og organiseret, kan de være ufuldstændige, indeholde dubletter eller indeholde fejl. Behovet for datarensning vil opstå som følge af problemer i den måde, data indsættes og lagres på. Datarensning er processen med at forhindre og rette disse fejl. Almindelige opgaver inkluderer posttilpasning, identifikation af unøjagtighed af data, generel kvalitet af eksisterende data, deduplisering og kolonnesegmentering. Sådanne dataproblemer kan også identificeres ved hjælp af en række analytiske teknikker. For eksempel med økonomiske oplysninger kan totalerne for bestemte variabler sammenlignes med separat offentliggjorte tal, der menes at være pålidelige. Usædvanlige beløb over eller under forudbestemte tærskler kan også gennemgås. Der er flere typer datarensning, der afhænger af typen af data, såsom telefonnumre, e-mail-adresser, arbejdsgivere osv.Kvantitative datametoder til påvisning af outlier kan bruges til at slippe af med sandsynligt forkert indtastede data. Tekstdata stavekontrol kan bruges til at mindske antallet af forkert indtastede ord, men det er sværere at fortælle om selve ordene er korrekte.
Analyser af sonderende data
Når dataene er renset, kan de analyseres. Analytikere kan anvende en række forskellige teknikker kaldet sonderende dataanalyse for at begynde at forstå meddelelserne indeholdt i dataene. Udforskningsprocessen kan resultere i yderligere datarensning eller yderligere anmodninger om data, så disse aktiviteter kan være iterative af karakter. Beskrivende statistikker såsom gennemsnittet eller medianen kan genereres for at hjælpe med at forstå dataene. Datavisualisering kan også bruges til at undersøge dataene i grafisk format for at få yderligere indsigt i meddelelserne i dataene.
Modellering og algoritmer
Matematiske formler eller modeller kaldet algoritmer kan anvendes på dataene til identifikation af sammenhænge mellem variablerne, såsom korrelation eller årsagssammenhæng . Generelt kan modeller udvikles til at evaluere en bestemt variabel i dataene baseret på andre variabler i dataene, med en vis restfejl afhængigt af modelnøjagtighed (dvs. Data = Model + Fejl).
Kilde: Dette