Jaka jest zależność między odchyleniem standardowym a dokładnością?


Najlepsza odpowiedź

Na to pytanie najlepiej odpowiedzieć na kilku prostych przykładach przedstawionych poniżej. Najczęstszym pytaniem statystycznym jest „Jak dokładna jest wartość czegoś, co zostało zmierzone lub policzone”. W rozkładzie normalnym (formalnie nazywanym rozkładem Gaussa) prawdopodobieństwo wartości równej jednemu standardowi. odchylenie od średniej (tj. jeden sigma) wynosi 5\%, a prawdopodobieństwo wystąpienia wartości 3 sigma od średniej wynosi 1\%. Zatem znajomość sigma pozwala na natychmiastowe oszacowanie dokładności obliczonej wartości. Jest to standardowa tabela statystyczna, która przedstawia prawdopodobieństwo błędu w funkcji sigma w szerokim zakresie.

Odpowiedź

Odpowiedź Matthew jest naprawdę najlepsza, jaką tutaj przeczytałem. Zamierzam spróbować nieco prostszego podejścia, mam nadzieję, że dodam kontekst dla tych, którzy nie są tak dobrze zorientowani w matematyce / statystykach.

Odchylenie standardowe próbki, które jest większe niż jego średnia może wskazywać różne rzeczy w zależności od danych, które ponownie badasz.

Średnia, jak stwierdził Matthew, jest w rzeczywistości opisem lokalizacji . Można je traktować jako rodzaj „środka masy” danych.

Odchylenie standardowe to opis rozrzutu danych, jak szeroko jest on rozłożony na podstawie średniej. Mniejsze odchylenie standardowe wskazuje, że więcej danych jest skupionych wokół średniej. Większy oznacza, że ​​dane są bardziej rozłożone.

Porównanie odchylenia standardowego ze średnią powie ci różne rzeczy w zależności od danych, z którymi pracujesz. Załóżmy na przykład, że Twoje dane reprezentują odległości mierzone nad i pod poziomem morza. Twoja średnia w tym przypadku może wynosić zero – poziom morza – a twoje odchylenie standardowe może wynosić 20 stóp. Oznaczałoby to, że większość pomiarów mieści się na wysokości 20 stóp nad poziomem morza i 20 stóp poniżej poziomu morza. Z drugiej strony, co by było, gdyby Twoje dane odzwierciedlały wiek mieszkańców kondominium w Palm Beach? W tym przypadku Twoja średnia może wynosić 85, a odchylenie standardowe 10, co oznacza, że ​​większość mieszkańców jest w wieku od 75 do 95 lat.

W pierwszym przypadku odchylenie standardowe jest większe niż średnia. W drugim przypadku jest mniejszy. Ale ostatecznie ich względny rozmiar ma niewielkie znaczenie – to, co mówią ci o strukturze danych, sposobie ich dystrybucji, jest ważne. Korzystając z tych informacji, możesz zacząć wyciągać wnioski na temat danych. Na przykład, w pierwszym zbiorze danych można było określić, czy dany punkt znajdował się znacznie wyżej nad poziomem morza niż wszystkie inne – tj. czy reprezentował anomalię statystyczną, którą warto było zbadać – w oparciu o liczbę odchyleń standardowych od średniej, w której się znajdował.

Należy wyjaśnić, że pojęcie odchylenia standardowego nie ogranicza się do danych o rozkładzie normalnym. Jest to ogólne pojęcie, które ma zastosowanie do danych, które pochodzą z dowolnego < / rozpiętość>. Cechą charakterystyczną odchylenia standardowego dla rozkładu normalnego jest to, że można je zastosować symetrycznie względem średniej, ponieważ normalna jest rozkładem symetrycznym. Chociaż inne rozkłady, takie jak F, T, Chi-kwadrat, Gamma lub Beta, nie są konsekwentnie symetryczne, nadal można dla nich obliczyć wariancję – a więc odchylenie standardowe.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *