Vad är sambandet mellan standardavvikelse och noggrannhet?


Bästa svaret

Frågan kan bäst besvaras med några enkla exempel enligt följande. Den vanligaste statistiska frågan är ”Hur exakt är värdet på något som har mätts eller räknats”. I en normalfördelning (formellt kallad en Gaussisk fördelning) är sannolikheten för ett värde som är ett std. avvikelse från medelvärdet (dvs. en sigma) är 5\% och sannolikheten för ett värde 3 sigma från medelvärdet är 1\%. Att känna till sigma tillåter således en omedelbar uppskattning av noggrannheten för det beräknade värdet. Deras är en standardstatistik som visar felsannolikheten jämfört med sigma över ett stort intervall.

Svar

Matthews svar är verkligen det bästa jag har läst här. Jag kommer att försöka med ett lite enklare tillvägagångssätt, förhoppningsvis att lägga till lite sammanhang för dem som inte är så kunniga i matematik / statistik.

Ett exempel på standardavvikelse som är större än dess medelvärdet kan indikera olika saker beroende på vilken data du undersöker.

Medlet, som Matthew uppgav, är verkligen en beskrivning av plats. Det kan ses som ett slags ”masscentrum” för dina data.

Standardavvikelsen är en beskrivning av datans spridning, hur omfattande det distribueras om medelvärdet. En mindre standardavvikelse indikerar att mer av data är grupperade om medelvärdet. En större visar att data är mer spridda.

Jämförelse av standardavvikelsen med medelvärdet berättar olika saker beroende på vilken data du arbetar med. Anta till exempel att dina data representerar avstånd uppmätta över och under havsnivån. Ditt medelvärde i detta fall kan vara noll – havsnivå – och din standardavvikelse kan vara 20 fot. Detta skulle indikera att de flesta av dina mätningar faller inom 20ft över och 20ft under havsnivån. Å andra sidan, vad händer om dina uppgifter representerar åldrarna hos invånarna i en villa i Palm Beach? I det här fallet kan ditt medelvärde vara 85 och din standardavvikelse kan vara 10, vilket indikerar att de flesta av invånarna faller mellan 75 och 95 år.

I det första fallet är standardavvikelsen större än medelvärdet. I det andra fallet är det mindre. Men i slutändan betyder deras relativa storlek lite – det är vad de berättar om datastrukturen, hur det distribueras, det är viktigt. Med hjälp av denna information kan du börja dra slutsatser om data. Till exempel, i den första datasetet kunde du avgöra om en viss punkt var signifikant högre över havsnivån än alla andra – dvs om den representerade en statistisk anomali som var värt att undersöka – baserat på hur många standardavvikelser från medelvärdet den befann sig.

En punkt att klargöra är att begreppet standardavvikelse inte är begränsat till normalt distribuerad data. Det är ett allmänt begrepp som gäller data som härrör från alla distribution Vad som är speciellt med standardavvikelsen för normalfördelningen är att den kan tillämpas symmetriskt om medelvärdet, eftersom det normala är en symmetrisk fördelning. Även om andra fördelningar, såsom F, T, Chi-kvadrat, Gamma eller Beta, inte är konsekvent symmetriska, kan en avvikelse – och därför en standardavvikelse – fortfarande beräknas för dem.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *