Jaký je vztah mezi směrodatnou odchylkou a přesností?


Nejlepší odpověď

Na otázku lze nejlépe odpovědět pomocí několika jednoduchých příkladů. Nejběžnější statistická otázka je „Jak přesná je hodnota něčeho, co bylo změřeno nebo spočítáno“. V normálním rozdělení (formálně nazývaném Gaussovo rozdělení) je pravděpodobnost hodnoty, která je jedna standardní hodnota. odchylka od průměru (tj. jednoho sigma) je 5\% a pravděpodobnost hodnoty 3 sigma od průměru je 1\%. Znalost sigma tedy umožňuje okamžitý odhad přesnosti vypočítané hodnoty. Jedná se o standardní statistickou tabulku, která uvádí pravděpodobnost chyby vs. sigma v širokém rozsahu.

Odpověď

Matoušova odpověď je opravdu nejlepší, kterou jsem zde četl. Pokusím se o trochu jednodušší přístup, doufejme, že přidám nějaký kontext pro ty, kteří nejsou tak dobře obeznámeni s matematikou / statistikami.

Standardní odchylka vzorku, která má větší velikost než její průměr může znamenat různé věci v závislosti na datech, která zkoumáte.

Průměr, jak uvedl Matthew, je ve skutečnosti popisem umístění. Lze to považovat za jakési „těžiště“ vašich dat.

Směrodatná odchylka je popisem šíření dat, v jaké míře jsou distribuovány kolem průměru. Menší směrodatná odchylka naznačuje, že více dat je seskupeno kolem průměru. Větší znamená, že data jsou více rozprostřena.

Porovnání standardní odchylky se střední hodnotou vám řekne různé věci v závislosti na datech, se kterými pracujete. Řekněme například, že vaše data představují vzdálenosti měřené nad a pod hladinou moře. Váš průměr v tomto případě může být nula – hladina moře – a vaše standardní odchylka může být 20 stop. To by znamenalo, že většina vašich měření spadá do 20 stop nad a 20 stop pod hladinou moře. Na druhou stranu, co kdyby vaše data představovala věk obyvatel v kondominiu v Palm Beach? V tomto případě může být váš průměr 85 a vaše standardní odchylka 10, což naznačuje, že většina obyvatel spadá do věku 75 až 95 let.

V prvním případě je standardní odchylka větší než průměr. Ve druhém případě je menší. Ale na jejich relativní velikosti nakonec záleží jen málo – je to to, co vám řeknou o struktuře dat, způsobu jejich distribuce, což je důležité. Pomocí těchto informací můžete začít z dat vyvozovat závěry. Například v první datové sadě můžete určit, zda určitý bod byl významně vyšší nad hladinou moře než všechny ostatní – tj. zda představoval statistickou anomálii, která stála za prozkoumání – na základě toho, kolik standardních odchylek od průměru se nacházel.

Jedním bodem k objasnění je, že koncept směrodatné odchylky se neomezuje pouze na normálně distribuovaná data. Jde o obecný koncept, který se vztahuje na data, která vznikají z any distribuce. Na směrodatné odchylce pro normální distribuci je zvláštní to, že ji lze aplikovat symetricky na průměr, protože normální je symetrické rozdělení. Ačkoli jiná distribuce, například F, T, chí kvadrát, Gamma neboli Beta nejsou důsledně symetrické, lze pro ně stále vypočítat odchylku – a tedy směrodatnou odchylku.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *