データ分析の例をいくつか挙げてください。


ベストアンサー

基本的にGoogleには何百万ものデータ分析の例があるので、ここでもう少し「楽しい」を紹介します。 」分析。これについては常に考えているわけではありません。

BEER の分析(今ではみんなの注目を集めています;))

ビールの「セルフサービス」を実装することで(誰もが少しずつ異なる種類のビールを注ぐことができます)、バーの入札者は平均消費量が多いことに気づいただけでなく、何を知ることができました。好きなビールです。ビール分析は、最も速く消費されたビールとその時期(ギネス樽が聖パトリックの日に記録に達している)を知るのにも役立ち、より正確に予測して注文することができます。より「スパイ」レベルでは、一部のバーテンダーがパイントを注ぐときに「寛大」であるかどうか、または彼らが(自分自身またはクライアントに)多くを提供する傾向があるかどうかを確認できます。

-カジノでの分析

すべてのカジノマシン(またはカーペット)が生成しているデータを追跡することにより、マネージャーは何が使用され、何が使用されていないか、何が最も人気があり、いつ、1か月、または1年であるかについてより多くの知識を得ることができます。 、最大の利益(または損失)を生み出しているもの。これらすべての洞察により、彼らはそれに応じて行動し、カジノの一部を修正または調整するための適切な措置を講じることができます。

いずれにせよ、分析を実行するには、常に権利を身に付けることが重要です。 データ分析ツールデータクリーニング作業を容易にし、探索を強化します。

提供されているような例をもっと読みたい場合上記の記事をお読みください:バー、レストラン、カジノでの実際の生活における5つのビッグデータの例

回答

分析とは、個々の検査のために全体を個別のコンポーネントに分割することです。データ分析は、生データを取得し、それをユーザーの意思決定に役立つ情報に変換するためのプロセスです。データを収集して分析し、質問に答えたり、仮説をテストしたり、理論を反証したりします。

統計学者 John Tukey は、1961年にデータ分析を次のように定義しました。「手順データを分析するため、そのような手順の結果を解釈するための技術、分析をより簡単、より正確、またはより正確にするためのデータの収集を計画する方法、およびデータの分析に適用される(数学的な)統計のすべての機構と結果。」

以下に説明するように、区別できるいくつかのフェーズがあります。後のフェーズからのフィードバックにより、前のフェーズで追加の作業が発生する可能性があるため、フェーズは反復的です。

データ要件

分析への入力として必要なデータは、分析を指示する人または分析の完成品を使用する顧客の要件に基づいて指定されます。データが収集される一般的なタイプのエンティティは、実験単位と呼ばれます(たとえば、人または人の集団)。母集団に関する特定の変数(年齢や収入など)を指定して取得できます。データは数値またはカテゴリ(つまり、数値のテキストラベル)の場合があります。

データ収集

データはさまざまなソースから収集されます。要件は、アナリストによって、組織内の情報技術担当者などのデータの管理者に伝達される場合があります。データは、交通カメラ、衛星、記録装置などの環境内のセンサーから収集することもできます。また、インタビュー、オンラインソースからのダウンロード、またはドキュメントの閲覧を通じて取得することもできます。

データ処理

最初に取得したデータは、分析のために処理または整理する必要があります。たとえば、これらには、スプレッドシートや統計ソフトウェア内など、さらに分析するためにデータを表形式で行と列に配置することが含まれる場合があります。

データクリーニング

処理および整理されると、データが不完全であるか、重複しているか、エラーが含まれている可能性があります。データクリーニングの必要性は、データの入力と保存の方法の問題から生じます。データクリーニングは、これらのエラーを防止および修正するプロセスです。一般的なタスクには、レコードマッチング、データの不正確さの特定、既存のデータの全体的な品質、重複排除、列のセグメンテーションなどがあります。このようなデータの問題は、さまざまな分析手法によっても特定できます。たとえば、財務情報を使用して、特定の変数の合計を、信頼できると思われる個別に公開された数値と比較することができます。所定のしきい値を超えるまたは下回る異常な金額も確認できます。電話番号、電子メールアドレス、雇用者などのデータの種類に応じて、データクリーニングにはいくつかの種類があります。外れ値を検出するための定量的データ手法を使用して、誤って入力された可能性のあるデータを取り除くことができます。テキストデータのスペルチェッカーを使用すると、入力ミスのある単語の量を減らすことができますが、単語自体が正しいかどうかを判断するのは困難です。

探索的データ分析

データがクリーンアップされると、分析できます。アナリストは、探索的データ分析と呼ばれるさまざまな手法を適用して、データに含まれるメッセージの理解を開始できます。探索のプロセスにより、追加のデータクリーニングまたはデータの追加要求が発生する可能性があるため、これらのアクティビティは本質的に反復的である可能性があります。 平均や中央値などの記述統計は、データの理解に役立つように生成される場合があります。 データの視覚化を使用して、データをグラフ形式で調べ、データ内のメッセージに関する追加の洞察を得ることができます。

モデリングとアルゴリズム

アルゴリズムと呼ばれる数式またはモデルをに適用できます相関原因などの変数間の関係を識別するためのデータ。一般的に、モデルは、データ内の他の変数に基づいてデータ内の特定の変数を評価するために開発できますが、モデルの精度に応じていくつかの残差があります(つまり、データ=モデル+エラー)。

出典:これ

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です