Legjobb válasz
A kérdésre a következő néhány egyszerű példával lehet a legjobban válaszolni. A leggyakoribb statisztikai kérdés: „Mennyire pontos valaminek az értéke, amit mértek vagy megszámláltak”. Normál eloszlásban (formálisan Gauss-eloszlásnak hívják) annak a valószínűsége, hogy egy érték standard. az átlagtól (azaz az egy szigma) való eltérés 5\%, és a 3 sigma érték valószínűsége az átlagtól 1\%. Így a szigma ismerete lehetővé teszi a számított érték pontosságának azonnali becslését. Ezek egy szokásos statisztikai táblázat, amely széles tartományban sorolja fel a hiba valószínűségét a szigma és a szigma között.
Válasz
Matthew válasza a legjobb, amit itt olvastam. Megpróbálok valamivel egyszerűbb megközelítést alkalmazni, remélhetőleg hozzáadok néhány kontextust azok számára, akik nem ismerik annyira a matematikát / statisztikákat.
A minta szórása nagyobb, mint annak A mean az Ön által vizsgált adatoktól függően különböző dolgokat jelölhet.
Az átlag, amint Matthew kijelentette, valójában a hely leírása. Ez az adatok egyfajta “tömegközéppontjának” tekinthető.
A szórás az adatok terjedésének leírása, hogy milyen széles körben vannak elosztva az átlag körül. Kisebb szórás azt jelzi, hogy az adatok több része az átlag körül van csoportosítva. Egy nagyobb azt jelzi, hogy az adatok szétszórtabbak.
Ha összehasonlítjuk a szórást az átlaggal, akkor a dolgoktól függően különböző dolgokat mondunk el. Tegyük fel például, hogy az adatok a tengerszint felett és alatt mért távolságokat képviselik. Az átlagod ebben az esetben nulla lehet – a tengerszint -, a szórásod pedig 20 láb lehet. Ez azt jelezné, hogy a legtöbb mérésed a tengerszint feletti és 20 méteres magasságon belül esik. Másrészt mi lenne, ha az adatai a Palm Beach-i társasházban lakók korát tükröznék? Ebben az esetben az átlagod 85, a szórásod pedig 10 lehet, ami azt jelzi, hogy a lakosok többsége 75 és 95 év közé esik.
Az első esetben a szórás nagyobb mint az átlag. A második esetben kisebb. De végső soron a relatív méretük kevéssé számít – ez az, amit elmondanak neked az adatok szerkezetéről, az elosztás módjáról, ami fontos. Ezen információk felhasználásával elkezdhet következtetéseket levonni az adatokról. Például az első adatkészletben meg tudta állapítani, hogy egy adott pont szignifikánsan magasabb-e a tengerszint felett, mint az összes többi – azaz olyan statisztikai anomáliát képvisel-e, amelyet érdemes megvizsgálni – annak alapján, hogy hány szórás van az átlagtól.
Egyértelművé kell tenni, hogy a szórás fogalma nem korlátozódik a normálisan elosztott adatokra. Ez egy általános fogalom, amely azokra az adatokra vonatkozik, amelyek bármely eloszlás. A normál eloszlás szórása különlegessége, hogy szimmetrikusan alkalmazható az átlagra, mivel a normális szimmetrikus eloszlás. Bár más eloszlások, például az F, T, a Khi-négyzet, Gamma vagy Beta, nem következetesen szimmetrikusak, továbbra is kiszámítható számukra egy variancia – és ezért a szórás.