Cel mai bun răspuns
La întrebare se poate răspunde cel mai bine prin câteva exemple simple, după cum urmează. Cea mai frecventă întrebare statistică este „Cât de precisă este valoarea unui lucru care a fost măsurat sau numărat”. Într-o distribuție normală (numită în mod oficial o distribuție gaussiană) probabilitatea unei valori care este una std. deviația de la medie (adică o sigmă) este de 5\%, iar probabilitatea unei valori 3 sigma de la medie este de 1\%. Astfel, cunoașterea sigmei permite o estimare imediată a acurateței valorii calculate. Al lor este un tabel statistic standard care listează probabilitatea de eroare față de sigma pe o gamă largă.
Răspuns
Răspunsul lui Matthew este într-adevăr cel mai bun pe care l-am citit aici. Voi încerca o abordare ușor mai simplă, sper să adaug un anumit context pentru cei care nu sunt la fel de versați în matematică / statistici. media poate indica diferite lucruri în funcție de datele pe care le examinați.
Media, așa cum a afirmat Matthew, este într-adevăr o descriere a locației . Se poate considera că este un fel de „centru de masă” al datelor dvs.
Abaterea standard este o descriere a răspândirii datelor, cât de larg este distribuit în medie. O abatere standard mai mică indică faptul că mai multe date sunt grupate în jurul valorii medii. Unul mai mare indică faptul că datele sunt mai răspândite.
Comparând abaterea standard la medie vă vor spune lucruri diferite în funcție de datele cu care lucrați. De exemplu, să spunem că datele dvs. reprezintă distanțe măsurate deasupra și sub nivelul mării. În acest caz, media dvs. ar putea fi zero – nivelul mării – și abaterea standard ar putea fi de 20 de metri. Acest lucru ar indica faptul că majoritatea măsurătorilor dvs. se încadrează la 20ft deasupra și 20ft sub nivelul mării. Pe de altă parte, ce se întâmplă dacă datele dvs. ar reprezenta vârsta rezidenților dintr-un condominiu din Palm Beach? În acest caz, media dvs. ar putea fi de 85, iar abaterea standard ar putea fi de 10, indicând faptul că majoritatea rezidenților se încadrează între 75 și 95 de ani.
În primul caz, abaterea standard este mai mare decât media. În al doilea caz, este mai mic. Dar, în cele din urmă, dimensiunea lor relativă contează puțin – este important ceea ce vă spun despre structura datelor, modul în care sunt distribuite. Folosind aceste informații, puteți începe să faceți inferențe despre date. De exemplu, în primul set de date, ați putea stabili dacă un anumit punct a fost semnificativ mai mare deasupra nivelului mării decât toate celelalte – adică dacă a reprezentat o anomalie statistică care merită investigată – pe baza numărului de abateri standard de la media în care a fost localizat.
Un punct de clarificat este că conceptul de deviație standard nu se limitează la datele distribuite în mod normal. Este un concept general care se aplică datelor care apar din orice distribuție. Ceea ce este special la abaterea standard pentru distribuția normală este că poate fi aplicată simetric în raport cu media, deoarece normalul este o distribuție simetrică. Deși alte distribuții, cum ar fi F, T, Chi-pătrat, Gamma sau Beta, nu sunt în mod constant simetrice, o varianță – și, prin urmare, o abatere standard – poate fi încă calculată pentru ele.