Hva er forholdet mellom standardavvik og nøyaktighet?


Beste svaret

Spørsmålet kan best besvares med noen få enkle eksempler som følger. Det vanligste statistiske spørsmålet er «Hvor nøyaktig er verdien av noe som er målt eller talt». I en normalfordeling (formelt kalt en gaussisk fordeling) er sannsynligheten for en verdi som er en std. avvik fra gjennomsnittet (dvs. en sigma) er 5\%, og sannsynligheten for en verdi 3 sigma fra gjennomsnittet er 1\%. Dermed tillater vitende sigma et øyeblikkelig estimat av nøyaktigheten til den beregnede verdien. Deres er en standard statistisk tabell som viser feilsannsynligheten mot sigma over et bredt spekter.

Svar

Matthews svar er virkelig det beste jeg har lest her. Jeg kommer til å prøve en litt enklere tilnærming, forhåpentligvis å legge til litt sammenheng for de som ikke er så kjent med matematikk / statistikk.

Et eksempel på standardavvik som er større enn det gjennomsnitt kan indikere forskjellige ting avhengig av dataene du undersøker.

Gjennomsnittet, som Matthew uttalte, er egentlig en beskrivelse av plassering. Det kan tenkes som en slags «massesenter» av dataene dine.

Standardavviket er en beskrivelse av datas spredning, hvor bredt det er distribuert om gjennomsnittet. Et mindre standardavvik indikerer at flere av dataene er gruppert om gjennomsnittet. En større indikerer at dataene er mer spredte.

Å sammenligne standardavviket til gjennomsnittet vil fortelle deg forskjellige ting, avhengig av dataene du jobber med. Si for eksempel at dataene dine representerer avstander målt over og under havnivå. Gjennomsnittet ditt i dette tilfellet kan være null – havnivå – og standardavviket ditt kan være 20 fot. Dette vil indikere at de fleste av målene dine faller innenfor 20ft over og 20ft under havnivå. På den annen side, hva om dataene dine representerte alderen på innbyggerne i et condominium i Palm Beach? I dette tilfellet kan gjennomsnittet ditt være 85, og standardavviket ditt kan være 10, noe som indikerer at de fleste av beboerne faller mellom 75 og 95 år.

I det første tilfellet er standardavviket større enn gjennomsnittet. I det andre tilfellet er det mindre. Men til slutt har deres relative størrelse liten betydning – det er det de forteller deg om datastrukturen, måten den distribueres på, som er viktig. Ved å bruke denne informasjonen kan du begynne å slutte om dataene. For eksempel, i det første datasettet kunne du bestemme om et bestemt punkt var betydelig høyere enn havnivået enn alle andre – dvs. om det representerte en statistisk anomali som var verdt å undersøke – basert på hvor mange standardavvik som var borte fra gjennomsnittet det var lokalisert.

Et poeng å avklare er at begrepet standardavvik ikke er begrenset til normalt distribuerte data. Det er et generelt begrep som gjelder data som oppstår fra alle distribution. Det som er spesielt med standardavviket for normalfordelingen er at det kan brukes symmetrisk om gjennomsnittet, siden normal er en symmetrisk fordeling. Selv om andre distribusjoner, som F, T, Chi-kvadrat, Gamma, eller Beta, ikke er konsekvent symmetriske, kan en variasjon – og derfor et standardavvik – fortsatt beregnes for dem.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *