Paras vastaus
Tilastokeskiarvon selkeää määritelmää on vaikea löytää, vaikka termiä käytetään laajalti. Ymmärrän, että se on datasta laskettu keskiarvo. Mikä tahansa datasta laskettu määrä on ”tilasto”, joten oletan termin tilastollinen keskiarvo. Eri keskiarvot voidaan laskea datasta, kuten keskiarvo, tila ja mediaani. Aritmeettisella keskiarvolla tai aritmeettisella keskiarvolla on se etu, että se on puolueeton estimaattori populaation keskiarvolle.
Oletetaan, että meillä on n riippumatonta estimaattia y\_i määrälle y, joka saadaan mittauksista tai havainnoista. Aritmeettinen keskiarvo lasketaan seuraavasti:
\ bar y (n) = \ frac {1} {n} \ summa \ limits\_ {i = 1} ^ n y\_i
\ bar y on satunnaismuuttuja, koska joka kerta kun keräämme uuden tietojoukon, odotamme laskevamme sille jonkin verran erilaista arvoa.
Tietojoukkomme voi olla histogrammin muotoinen, ja L-lokeroilla on tasot u\_1 , u\_2,… u\_L ja useita havaintoja kussakin lokerossa. Oletetaan, että astia u\_k sisältää n\_k-havaintoja. Aritmeettinen keskiarvo lasketaan nyt painotettuna keskiarvona.
\ bar u = \ frac {1} {n} \ summa \ limits\_ {k = 1} ^ L n\_k u\_k = \ summa \ limits\_ {k = 1} ^ L \ frac {n\_k} {n} u\_k
missä \ frac {n\_k} {n} on tason u\_k suhteellinen taajuus.
Tilastollinen keskiarvo on tärkeä puolueeton estimaattori (yleensä tuntemattoman) todennäköisyysjakauman keskiarvosta (odotettavissa oleva arvo).