Quels sont quelques exemples danalyse de données?

Meilleure réponse

En gros, vous pouvez avoir un million dexemples danalyse de données sur Google, donc je vais vous donner ici encore plus de « fun ”, À laquelle nous ne pensons pas toujours.

– Analytics pour BIÈRE (maintenant jai lattention de tout le monde;))

En mettant en place un «self-service» pour les bières (chacun peut se verser un peu de types différents), non seulement les barmans ont réalisé que la consommation moyenne était plus élevée, mais ils ont également pu savoir ce que sont les bières préférées. Lanalyse des bières peut également aider à savoir quelles sont les bières qui sont consommées le plus rapidement et quand (les fûts Guiness atteignent des records le jour de la Saint-Patrick), afin danticiper et de commander avec une précision accrue. À un niveau plus «despionnage», vous pouvez voir si certains barmans sont plus «généreux» lorsquils versent des pintes, ou sils ont tendance à en offrir beaucoup (à eux-mêmes ou aux clients).

– Analytics in Casinos

En suivant les données produites par chaque machine de casino (ou tapis), les gestionnaires ont plus de connaissances sur ce qui est utilisé et ce qui ne lest pas, quels sont les plus populaires et à quelle heure de la journée, du mois ou de lannée , ce qui génère le plus de profit (ou de perte). Avec toutes ces informations, ils peuvent agir en conséquence et prendre les mesures appropriées pour rectifier ou ajuster certaines parties de leur casino.

Dans tous les cas, pour effectuer votre analyse, il est toujours bon de séquiper du droit outils danalyse de données qui faciliteront le travail de nettoyage des données, pour une exploration améliorée.

Si vous souhaitez lire plus dexemples comme ceux fournis ci-dessus, je vous invite à lire cet article: 5 exemples de Big Data dans votre vie réelle dans les bars, restaurants et casinos !

Réponse

Lanalyse se réfère à la division dun tout en ses composants séparés pour un examen individuel. Lanalyse des données est un processus pour obtenir des données brutes et les convertir en informations utiles pour la prise de décision par les utilisateurs. Les données sont collectées et analysées pour répondre à des questions, tester des hypothèses ou réfuter des théories.

Le statisticien John Tukey a défini lanalyse des données en 1961 comme suit: « Procédures pour analyser les données, les techniques pour interpréter les résultats de ces procédures, les moyens de planifier la collecte des données pour rendre son analyse plus facile, plus précise ou plus précise, et tous les mécanismes et résultats des statistiques (mathématiques) qui sappliquent à lanalyse des données.  »

Il existe plusieurs phases qui peuvent être distinguées, décrites ci-dessous. Les phases sont itératives, en ce sens que les commentaires des phases ultérieures peuvent entraîner des travaux supplémentaires dans les phases précédentes.

Données requises

Les données nécessaires comme données dentrée à lanalyse sont spécifiées en fonction des exigences de ceux qui dirigent lanalyse ou des clients qui utiliseront le produit fini de lanalyse. Le type général dentité sur lequel les données seront collectées est appelé unité expérimentale (par exemple, une personne ou une population de personnes). Des variables spécifiques concernant une population (par exemple, lâge et le revenu) peuvent être précisées et obtenues. Les données peuvent être numériques ou catégoriques (cest-à-dire, une étiquette de texte pour les nombres).

Collecte de données

Les données sont recueillies auprès de diverses sources. Les exigences peuvent être communiquées par les analystes aux dépositaires des données, tels que le personnel informatique au sein dune organisation. Les données peuvent également être collectées à partir de capteurs dans lenvironnement, tels que des caméras de circulation, des satellites, des appareils denregistrement, etc. Elles peuvent également être obtenues par le biais dentretiens, de téléchargements à partir de sources en ligne ou de lecture de documentation.

Traitement des données

Les données initialement obtenues doivent être traitées ou organisées pour analyse. Par exemple, cela peut impliquer de placer des données dans des lignes et des colonnes dans un format de tableau pour une analyse plus approfondie, comme dans une feuille de calcul ou un logiciel statistique.

Nettoyage des données

Une fois traitées et organisées, les données peuvent être incomplètes, contenir des doublons ou contenir des erreurs. Le besoin de nettoyage des données résultera de problèmes dans la manière dont les données sont saisies et stockées. Le nettoyage des données est le processus de prévention et de correction de ces erreurs. Les tâches courantes incluent la mise en correspondance des enregistrements, lidentification de linexactitude des données, la qualité globale des données existantes, la déduplication et la segmentation des colonnes. Ces problèmes de données peuvent également être identifiés grâce à diverses techniques analytiques. Par exemple, avec des informations financières, les totaux pour des variables particulières peuvent être comparés à des chiffres publiés séparément considérés comme fiables. Les montants inhabituels supérieurs ou inférieurs à des seuils prédéterminés peuvent également être examinés. Il existe plusieurs types de nettoyage de données qui dépendent du type de données telles que les numéros de téléphone, les adresses e-mail, les employeurs, etc.Des méthodes de données quantitatives pour la détection des valeurs aberrantes peuvent être utilisées pour se débarrasser des données probablement mal saisies. Les vérificateurs orthographiques des données textuelles peuvent être utilisés pour réduire le nombre de mots mal saisis, mais il est plus difficile de dire si les mots eux-mêmes sont corrects.

Analyse exploratoire des données

Une fois les données nettoyées, elles peuvent être analysées. Les analystes peuvent appliquer diverses techniques appelées analyse exploratoire des données pour commencer à comprendre les messages contenus dans les données. Le processus dexploration peut entraîner un nettoyage supplémentaire des données ou des demandes supplémentaires de données, de sorte que ces activités peuvent être de nature itérative. Des Des statistiques descriptives telles que la moyenne ou la médiane peuvent être générées pour aider à comprendre les données. La La visualisation des données peut également être utilisée pour examiner les données au format graphique, afin dobtenir des informations supplémentaires sur les messages contenus dans les données.

Modélisation et algorithmes

Des formules mathématiques ou des modèles appelés algorithmes peuvent être appliqués à les données permettant didentifier les relations entre les variables, telles que corrélation ou causalité . En termes généraux, des modèles peuvent être développés pour évaluer une variable particulière dans les données en se basant sur dautres variables dans les données, avec une certaine erreur résiduelle en fonction de la précision du modèle (cest-à-dire, Data = Model + Error).

Source: Ceci

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *