ベストアンサー
この質問には、次のいくつかの簡単な例で最もよく答えることができます。最も一般的な統計的質問は、「測定またはカウントされたものの値はどれほど正確か」です。正規分布(正式にはガウス分布と呼ばれます)では、値が1標準である確率。平均からの偏差(つまり、1シグマ)は5%であり、平均からの値3シグマの確率は1%です。したがって、シグマを知ることにより、計算値の精度を即座に見積もることができます。それらは、広範囲にわたるエラー確率とシグマをリストした標準的な統計表です。
回答
マシューの回答は、私がここで読んだ中で本当に最高のものです。私は少し単純なアプローチを試みます。うまくいけば、数学/統計にあまり精通していない人のためにいくつかのコンテキストを追加します。
サンプルの標準偏差はそのよりも大きいです。平均値は、調査しているデータに応じて異なることを示す場合があります。
マシューが述べたように、平均値は実際には場所の説明です。これは、データの一種の「質量の中心」と考えることができます。
標準偏差は、データの広がり、平均値の周りにどれだけ広く分布しているかの説明です。標準偏差が小さいほど、平均値に関してより多くのデータがクラスター化されていることを示します。大きい方は、データがより分散していることを示します。
標準偏差を平均と比較すると、作業しているデータに応じて異なることがわかります。たとえば、データが海面の上下で測定された距離を表しているとします。この場合の平均はゼロ(海面)であり、標準偏差は20フィートである可能性があります。これは、ほとんどの測定値が海面から20フィート上と20フィート下にあることを示しています。一方、データがパームビーチのコンドミニアムの居住者の年齢を表している場合はどうなりますか?この場合、平均は85、標準偏差は10であり、ほとんどの居住者が75歳から95歳の間にあることを示しています。
最初のケースでは、標準偏差が大きくなっています。平均より。 2番目のケースでは、それは小さくなります。しかし、最終的には、相対的なサイズはほとんど重要ではありません。データの構造、データの分散方法について教えてくれることが重要です。この情報を使用して、データに関する推論を開始できます。たとえば、最初のデータセットでは、特定のポイントが他のすべてのポイントよりも海抜が大幅に高いかどうか、つまり、特定のポイントが配置された平均からの標準偏差の数に基づいて、調査する価値のある統計的異常を表しているかどうかを判断できました。
明確にする1つのポイントは、標準偏差の概念が正規分布データに限定されないことです。これは、任意の<から発生するデータに適用される一般的な概念です。 / span>分布。正規分布の標準偏差の特別な点は、正規分布が対称分布であるため、平均に対して対称に適用できることです。ただし、F、T、Chi-square、ガンマ、またはベータ、は一貫して対称ではないため、分散(したがって標準偏差)を計算できます。