Paras vastaus
Kysymykseen voidaan parhaiten vastata muutamalla yksinkertaisella esimerkillä seuraavasti. Yleisin tilastokysymys on ”Kuinka tarkka on mitatun tai lasketun arvon arvo”. Normaalijakaumassa (jota kutsutaan muodollisesti Gaussin jakaumaksi) arvon todennäköisyys, joka on yksi vakio. poikkeama keskiarvosta (ts. yksi sigma) on 5\% ja arvon 3 sigma todennäköisyys keskiarvosta on 1\%. Sigman tunteminen antaa siten välittömän arvion lasketun arvon tarkkuudesta. He ovat tavallinen tilastotaulukko, jossa luetellaan virhetodennäköisyys vs. sigma laajalla alueella.
Vastaus
Matthewn vastaus on todella paras, jonka olen lukenut täältä. Yritän kokeilla hieman yksinkertaisempaa lähestymistapaa, toivottavasti lisätä asiayhteyden niille, jotka eivät ole yhtä perehtyneitä matematiikkaan / tilastoihin.
Näytteen keskihajonta, joka on suurempaa kuin sen mean voi osoittaa erilaisia asioita riippuen tiedoista, joita tutkit uudelleen.
Keskiarvo, kuten Matthew totesi, on todella kuvaus sijainnista . Sen voidaan ajatella olevan eräänlainen ”massan keskipiste” tiedoistasi.
Vakiopoikkeama on kuvaus tietojen levityksestä, kuinka laajalle se jakautuu keskiarvon suhteen. Pienempi keskihajonta osoittaa, että enemmän tietoa on ryhmitelty keskiarvon suhteen. Suurempi tarkoittaa, että tiedot ovat hajautetumpia.
Vertaamalla keskihajontaa keskiarvoon, kerrot eri asioita työskentelemiesi tietojen mukaan. Oletetaan esimerkiksi, että tietosi edustavat merenpinnan ylä- ja alapuolella mitattuja etäisyyksiä. Keskiarvo tässä tapauksessa voi olla nolla – merenpinta – ja keskihajonta voi olla 20 jalkaa. Tämä osoittaisi, että suurin osa mittauksistasi kuuluu 20 jalan korkeuteen ja 20 jalan alle merenpinnan. Toisaalta, entä jos tietosi edustaisivat asukkaiden ikää Palm Beachin osakehuoneistossa? Tässä tapauksessa keskiarvosi voi olla 85 ja keskihajonta voi olla 10, mikä osoittaa, että suurin osa asukkaista kuuluu 75-95-vuotiaisiin.
Ensimmäisessä tapauksessa keskihajonta on suurempi kuin keskiarvo. Toisessa tapauksessa se on pienempi. Mutta viime kädessä heidän suhteellisella koollaan ei ole merkitystä – se on se, mitä he kertovat sinulle tietojen rakenteesta, tavasta, jolla se jaetaan, mikä on tärkeää. Näiden tietojen avulla voit alkaa tehdä päätelmiä tiedoista. Esimerkiksi, ensimmäisessä tietojoukossa voit selvittää, onko tietty piste merkittävästi merenpinnan yläpuolella kuin kaikki muut – eli onko se tilastollinen poikkeama, joka kannattaa tutkia – sen perusteella, kuinka monta keskihajontaa poikkesi keskiarvosta.
Yksi selvennettävä asia on, että standardipoikkeaman käsite ei rajoitu normaalisti hajautettuihin tietoihin. Se on yleinen käsite, jota sovelletaan mistä tahansa