Wat is de relatie tussen standaarddeviatie en nauwkeurigheid?


Beste antwoord

De vraag kan het beste worden beantwoord door een paar eenvoudige voorbeelden als volgt. De meest voorkomende statistische vraag is “hoe nauwkeurig is de waarde van iets dat is gemeten of geteld”. In een normale verdeling (formeel een Gauss-verdeling genoemd) is de kans op een waarde die één standaard is. afwijking van het gemiddelde (d.w.z. één sigma) is 5\%, en de kans op een waarde van 3 sigma van het gemiddelde is 1\%. Het kennen van sigma maakt dus een onmiddellijke schatting mogelijk van de nauwkeurigheid van de berekende waarde. Er is een standaard statistische tabel die de foutkans versus sigma over een breed bereik weergeeft.

Antwoord

Matthews antwoord is echt het beste dat ik hier heb gelezen. Ik ga proberen voor een iets eenvoudigere benadering, hopelijk om wat context toe te voegen voor degenen die niet zo goed thuis zijn in wiskunde / statistieken.

De standaarddeviatie van een steekproef die groter is dan de mean kan verschillende dingen aangeven, afhankelijk van de gegevens die u “opnieuw onderzoekt.

Het gemiddelde is, zoals Matthew zei, in feite een beschrijving van de locatie. Het kan worden gezien als een soort “zwaartepunt” van uw gegevens.

De standaarddeviatie is een beschrijving van de spreiding van de gegevens, hoe breed deze over het gemiddelde is verdeeld. Een kleinere standaarddeviatie geeft aan dat meer van de gegevens geclusterd zijn rond het gemiddelde. Een grotere geeft aan dat de gegevens meer verspreid zijn.

Het vergelijken van de standaarddeviatie met het gemiddelde zal u verschillende dingen vertellen, afhankelijk van de gegevens waarmee u werkt. Stel dat uw gegevens afstanden vertegenwoordigen die boven en onder zeeniveau zijn gemeten. Uw gemiddelde kan in dit geval nul zijn – zeeniveau – en uw standaarddeviatie kan 6 meter zijn. Dit zou erop wijzen dat de meeste van uw metingen binnen 6 meter boven en 6 meter onder zeeniveau vallen. Aan de andere kant, wat als uw gegevens de leeftijden van bewoners in een condominium in Palm Beach vertegenwoordigen? In dit geval zou uw gemiddelde 85 kunnen zijn en uw standaarddeviatie zou 10 kunnen zijn, wat aangeeft dat de meeste inwoners tussen de 75 en 95 jaar oud zijn.

In het eerste geval is de standaarddeviatie groter dan het gemiddelde. In het tweede geval is het kleiner. Maar uiteindelijk doet hun relatieve grootte er weinig toe – het is wat ze u vertellen over de structuur van de gegevens, de manier waarop deze worden verdeeld, dat belangrijk is. Met behulp van deze informatie kunt u conclusies trekken over de gegevens. in de eerste dataset kon je bepalen of een bepaald punt significant hoger boven zeeniveau lag dan alle andere – dat wil zeggen of het een statistische anomalie vertegenwoordigde die het onderzoeken waard was – op basis van het aantal standaarddeviaties verwijderd van het gemiddelde waarop het zich bevond.

Een punt om te verduidelijken is dat het concept van standaarddeviatie niet beperkt is tot normaal verdeelde gegevens. Het is een algemeen concept dat van toepassing is op gegevens die voortkomen uit any distributie. Het bijzondere aan de standaarddeviatie voor de normaalverdeling is dat deze symmetrisch rond het gemiddelde kan worden toegepast, aangezien de normaal een symmetrische verdeling is. Hoewel andere verdelingen, zoals de F, T, Chi-kwadraat, Gamma of bèta, zijn niet consistent symmetrisch, een variantie – en dus een standaarddeviatie – kan er nog steeds voor worden berekend.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *