Wat zijn enkele voorbeelden van gegevensanalyse?

Beste antwoord

Je kunt in principe een miljoen voorbeelden van gegevensanalyse op Google hebben staan, dus ik zal je hier wat meer plezier ”Analyse, waaraan we niet altijd denken.

– Analytics voor BIER (nu heb ik ieders aandacht;))

Door een “zelfbediening” voor bieren te implementeren (iedereen kan zichzelf een beetje verschillende soorten schenken), realiseerden de barmannen niet alleen dat het gemiddelde verbruik hoger was, maar ze wisten ook wat zijn de favoriete bieren. Bierenanalyses kunnen ook helpen om te weten welke bieren het snelst worden geconsumeerd en wanneer (Guiness-vaatjes bereiken records op St. Patricks Day), zodat u met grotere precisie kunt anticiperen en bestellen. Op een meer “spionage” -niveau kunt u zien of sommige barmannen “genereuzer” zijn bij het inschenken van pintes, of dat ze de neiging hebben om veel te bieden (aan zichzelf of aan klanten).

– Analytics in casinos

Door de gegevens bij te houden die elke casinomachine (of tapijt) produceert, hebben managers meer kennis over wat wel en niet wordt gebruikt, wat het populairst is en op welk tijdstip van de dag, maand of jaar , wat genereert de meeste winst (of verlies). Met al deze inzichten kunnen ze dienovereenkomstig handelen en de gepaste maatregelen nemen om sommige delen van hun casino te corrigeren of aan te passen.

In ieder geval is het voor het uitvoeren van uw analyse altijd goed om uzelf uit te rusten met de juiste tools voor gegevensanalyse die het opschonen van gegevens vergemakkelijken, voor een betere verkenning.

Als u meer voorbeelden wilt lezen, zoals de gegeven hierboven nodig ik u uit om dit artikel te lezen: 5 voorbeelden van big data in uw echte leven in bars, restaurants en casinos !

Antwoord

Analyse verwijst naar het opsplitsen van een geheel in zijn afzonderlijke componenten voor individueel onderzoek. Gegevensanalyse is een proces voor het verkrijgen van ruwe gegevens en het omzetten ervan in informatie die nuttig is voor besluitvorming door gebruikers. Gegevens worden verzameld en geanalyseerd om vragen te beantwoorden, hypothesen te testen of theorieën te weerleggen.

Statisticus John Tukey definieerde data-analyse in 1961 als: “Procedures voor het analyseren van gegevens, technieken voor het interpreteren van de resultaten van dergelijke procedures, manieren om het verzamelen van gegevens te plannen om de analyse ervan gemakkelijker, nauwkeuriger of nauwkeuriger te maken, en alle machinerie en resultaten van (wiskundige) statistieken die van toepassing zijn op het analyseren van gegevens. ”

Er zijn verschillende fasen die kunnen worden onderscheiden, die hieronder worden beschreven. De fasen zijn iteratief, in die zin dat feedback uit latere fasen kan resulteren in aanvullend werk in eerdere fasen.

Gegevensvereisten

De gegevens die nodig zijn als input voor de analyse worden gespecificeerd op basis van de vereisten van degenen die de analyse leiden of klanten die het eindproduct van de analyse zullen gebruiken. Het algemene type entiteit waarop de gegevens zullen worden verzameld, wordt een experimentele eenheid genoemd (bijvoorbeeld een persoon of een populatie van mensen). Specifieke variabelen met betrekking tot een populatie (bijv. Leeftijd en inkomen) kunnen worden gespecificeerd en verkregen. Gegevens kunnen numeriek of categorisch zijn (dwz een tekstlabel voor getallen).

Gegevensverzameling

Gegevens zijn verzameld uit verschillende bronnen. De vereisten kunnen door analisten worden gecommuniceerd aan bewaarders van de gegevens, zoals informatietechnologiepersoneel binnen een organisatie. De gegevens kunnen ook worden verzameld van sensoren in de omgeving, zoals verkeerscameras, satellieten, opnameapparatuur, enz. Ze kunnen ook worden verkregen via interviews, downloads van online bronnen of het lezen van documentatie.

Gegevensverwerking

De aanvankelijk verkregen gegevens moeten worden verwerkt of georganiseerd voor analyse. Hierbij kan het bijvoorbeeld gaan om het plaatsen van gegevens in rijen en kolommen in een tabelindeling voor verdere analyse, zoals in een spreadsheet of statistische software.

Gegevens opschonen

Eenmaal verwerkt en georganiseerd, kunnen de gegevens onvolledig zijn, duplicaten bevatten of fouten bevatten. De noodzaak voor het opschonen van gegevens ontstaat door problemen met de manier waarop gegevens worden ingevoerd en opgeslagen. Het opschonen van gegevens is het proces waarbij deze fouten worden voorkomen en gecorrigeerd. Veel voorkomende taken zijn onder meer het matchen van records, het identificeren van onnauwkeurigheid van gegevens, de algehele kwaliteit van bestaande gegevens, ontdubbeling en kolomsegmentatie. Dergelijke gegevensproblemen kunnen ook worden geïdentificeerd door middel van een verscheidenheid aan analytische technieken. Met financiële informatie kunnen bijvoorbeeld de totalen voor bepaalde variabelen worden vergeleken met afzonderlijk gepubliceerde cijfers die als betrouwbaar worden beschouwd. Ongebruikelijke bedragen boven of onder vooraf bepaalde drempels kunnen ook worden herzien. Er zijn verschillende soorten gegevensopschoning die afhankelijk zijn van het type gegevens, zoals telefoonnummers, e-mailadressen, werkgevers enz.Kwantitatieve gegevensmethoden voor het detecteren van uitbijter kunnen worden gebruikt om waarschijnlijk onjuist ingevoerde gegevens te verwijderen. Spellingcontrole voor tekstgegevens kan worden gebruikt om het aantal verkeerd getypte woorden te verminderen, maar het is moeilijker te zeggen of de woorden zelf correct zijn.

Verkennende gegevensanalyse

Zodra de gegevens zijn opgeschoond, kunnen ze worden geanalyseerd. Analisten kunnen een verscheidenheid aan technieken toepassen die verkennende gegevensanalyse worden genoemd, om de berichten in de gegevens te begrijpen. Het verkenningsproces kan resulteren in extra opschonen van gegevens of aanvullende verzoeken om gegevens, dus deze activiteiten kunnen iteratief van aard zijn. Beschrijvende statistieken zoals het gemiddelde of mediaan kunnen worden gegenereerd om de gegevens beter te begrijpen. Datavisualisatie kan ook worden gebruikt om de gegevens in grafisch formaat te onderzoeken, om meer inzicht te krijgen met betrekking tot de berichten in de gegevens.

Modellering en algoritmen

Wiskundige formules of modellen genaamd algoritmen kunnen worden toegepast op de gegevens om relaties tussen de variabelen te identificeren, zoals correlatie of oorzakelijk verband . In algemene termen kunnen modellen worden ontwikkeld om een ​​bepaalde variabele in de gegevens te evalueren op basis van andere variabele (n) in de gegevens, met enige restfout afhankelijk van de nauwkeurigheid van het model (dwz Data = Model + Fout).

Bron: Dit

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *