Qual è la relazione tra deviazione standard e accuratezza?


Migliore risposta

La domanda può essere risolta al meglio con pochi semplici esempi come segue. La domanda statistica più comune è “Quanto è accurato il valore di qualcosa che è stato misurato o contato”. In una distribuzione normale (formalmente chiamata distribuzione gaussiana) la probabilità di un valore che è uno std. la deviazione dalla media (cioè un sigma) è del 5\% e la probabilità di un valore 3 sigma dalla media è dell1\%. Pertanto, conoscere sigma consente una stima immediata dellaccuratezza del valore calcolato. La loro è una tabella statistica standard che elenca la probabilità di errore rispetto al sigma su un ampio intervallo.

Risposta

La risposta di Matthew è davvero la migliore che ho letto qui. Proverò un approccio leggermente più semplice, si spera di aggiungere un po di contesto per coloro che non sono altrettanto esperti in matematica / statistiche.

La deviazione standard di un campione che è di grandezza maggiore della sua La media può indicare cose diverse a seconda dei dati che stai “riesaminando.

La media, come ha affermato Matthew, è in realtà una descrizione della posizione. Può essere pensato come una sorta di “centro di massa” dei tuoi dati.

La deviazione standard è una descrizione della diffusione dei dati, quanto ampiamente è distribuita rispetto alla media. Una deviazione standard più piccola indica che più dati sono raggruppati sulla media. Uno più grande indica che i dati sono più distribuiti.

Il confronto della deviazione standard con la media ti dirà cose diverse a seconda dei dati con cui stai lavorando. Ad esempio, supponiamo che i tuoi dati rappresentino le distanze misurate sopra e sotto il livello del mare. La tua media in questo caso potrebbe essere zero – livello del mare – e la tua deviazione standard potrebbe essere di 20 piedi. Ciò indicherebbe che la maggior parte delle misurazioni rientra tra 20 piedi sopra e 20 piedi sotto il livello del mare. Daltra parte, cosa succederebbe se i tuoi dati rappresentassero letà dei residenti in un condominio di Palm Beach? In questo caso, la tua media potrebbe essere 85 e la tua deviazione standard potrebbe essere 10, a indicare che la maggior parte dei residenti ha unetà compresa tra 75 e 95 anni.

Nel primo caso, la deviazione standard è maggiore rispetto alla media. Nel secondo caso, è più piccolo. Ma alla fine, la loro dimensione relativa conta poco: è ciò che ti dicono sulla struttura dei dati, il modo in cui sono distribuiti, che è importante. Utilizzando queste informazioni, puoi iniziare a fare inferenze sui dati. Ad esempio, nel primo set di dati, è stato possibile determinare se un punto particolare era significativamente più alto sul livello del mare rispetto a tutti gli altri – cioè se rappresentava unanomalia statistica che valeva la pena indagare – in base a quante deviazioni standard dalla media era localizzato.

Un punto da chiarire è che il concetto di deviazione standard non è limitato ai dati normalmente distribuiti. È un concetto generale che si applica ai dati che derivano da qualsiasi distribuzione. La particolarità della deviazione standard per la distribuzione normale è che può essere applicata simmetricamente rispetto alla media, poiché la normale è una distribuzione simmetrica. Sebbene altre distribuzioni, come F, T, Chi-quadrato, Gamma, o Beta, non sono costantemente simmetriche, una varianza, e quindi una deviazione standard, può ancora essere calcolata per loro.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *