Bedste svar
Spørgsmålet kan bedst besvares med et par enkle eksempler som følger. Det mest almindelige statistiske spørgsmål er “Hvor nøjagtig er værdien af noget, der er blevet målt eller talt”. I en normalfordeling (formelt kaldet en Gaussisk fordeling) er sandsynligheden for en værdi, der er en std. afvigelse fra gennemsnittet (dvs. en sigma) er 5\%, og sandsynligheden for en værdi 3 sigma fra gennemsnittet er 1\%. At kende sigma tillader således et øjeblikkeligt skøn over nøjagtigheden af den beregnede værdi. Deres er en standard statistisk tabel, der viser fejlsandsynligheden i forhold til sigma over et bredt interval.
Svar
Matthews svar er virkelig det bedste, jeg har læst her. Jeg vil prøve en lidt enklere tilgang, forhåbentlig at tilføje nogle sammenhænge for dem, der ikke er så velbevandrede i matematik / statistik.
En standardafvigelse fra en prøve, der er større end dens middel kan indikere forskellige ting afhængigt af de data, du undersøger.
Middelværdien, som Matthew sagde, er virkelig en beskrivelse af placering. Det kan betragtes som en slags “massecenter” af dine data.
Standardafvigelsen er en beskrivelse af datas spredning, hvor bredt det distribueres om middelværdien. En mindre standardafvigelse indikerer, at flere af dataene er grupperet om gennemsnittet. En større indikerer, at dataene er mere spredte.
Sammenligning af standardafvigelsen med gennemsnittet fortæller dig forskellige ting afhængigt af de data, du arbejder med. Sig for eksempel, at dine data repræsenterer afstande målt over og under havets overflade. Dit gennemsnit i dette tilfælde kan være nul – havniveau – og din standardafvigelse kan være 20ft. Dette vil indikere, at de fleste af dine målinger falder inden for 20ft over og 20ft under havets overflade. På den anden side, hvad hvis dine data repræsenterede aldrene for beboerne i et ejerlejlighed i Palm Beach? I dette tilfælde kan dit gennemsnit være 85, og din standardafvigelse kunne være 10, hvilket indikerer, at de fleste beboere falder mellem 75 og 95 år.
I det første tilfælde er standardafvigelsen større end middelværdien. I det andet tilfælde er det mindre. Men i sidste ende betyder deres relative størrelse ikke meget – det er, hvad de fortæller dig om datastrukturen, den måde, de distribueres på, det er vigtigt. Ved hjælp af disse oplysninger kan du begynde at slutte om dataene. For eksempel i det første datasæt kunne du bestemme, om et bestemt punkt var signifikant højere over havets overflade end alle andre – dvs. om det repræsenterede en statistisk anomali, der var værd at undersøge – baseret på hvor mange standardafvigelser væk fra gennemsnittet, det var placeret.
Et punkt, der skal præciseres, er, at begrebet standardafvigelse ikke er begrænset til normalt distribuerede data. Det er et generelt begreb, der gælder for data, der stammer fra enhver distribution. Hvad der er specielt ved standardafvigelsen for normalfordelingen er, at den kan anvendes symmetrisk om gennemsnittet, da normal er en symmetrisk fordeling. Selvom andre fordelinger, såsom F, T, Chi-kvadrat, Gamma eller Beta, ikke er konsekvent symmetriske, kan en variation – og derfor en standardafvigelse – stadig beregnes for dem.