¿Cuál es la relación entre la desviación estándar y la precisión?


Mejor respuesta

La mejor forma de responder a la pregunta es con unos pocos ejemplos simples como se indica a continuación. La pregunta estadística más común es «¿Qué tan exacto es el valor de algo que se ha medido o contado». En una distribución normal (formalmente denominada distribución gaussiana), la probabilidad de un valor que es uno estándar. la desviación de la media (es decir, un sigma) es del 5\%, y la probabilidad de un valor de 3 sigma de la media es del 1\%. Por tanto, conocer sigma permite una estimación inmediata de la precisión del valor calculado. Hay una tabla estadística estándar que enumera la probabilidad de error frente a sigma en un amplio rango.

Respuesta

La respuesta de Matthew es realmente la mejor que he leído aquí. Voy a intentar un enfoque un poco más simple, con suerte para agregar algo de contexto para aquellos que no están tan versados ​​en matemáticas / estadísticas.

La desviación estándar de una muestra que es de mayor magnitud que su mean puede indicar diferentes cosas dependiendo de los datos que «estás examinando.

La media, como dijo Matthew, es realmente una descripción de la ubicación. Se puede considerar como una especie de «centro de masa» de sus datos.

La desviación estándar es una descripción de la distribución de los datos, la amplitud con la que se distribuyen sobre la media. Una desviación estándar más pequeña indica que más datos están agrupados alrededor de la media. Una más grande indica que los datos están más dispersos.

La comparación de la desviación estándar con la media le dirá diferentes cosas según los datos con los que esté trabajando. Por ejemplo, supongamos que sus datos representan distancias medidas por encima y por debajo del nivel del mar. Su media en este caso podría ser cero (nivel del mar) y su desviación estándar podría ser de 20 pies. Esto indicaría que la mayoría de sus medidas caen dentro de los 20 pies por encima y 20 pies por debajo del nivel del mar. Por otro lado, ¿qué pasaría si sus datos representaran las edades de los residentes en un condominio de Palm Beach? En este caso, su media podría ser 85 y su desviación estándar podría ser 10, lo que indica que la mayoría de los residentes se encuentran entre las edades de 75 y 95.

En el primer caso, la desviación estándar es mayor que la media. En el segundo caso, es más pequeño. Pero, en última instancia, su tamaño relativo importa poco; lo que le dicen sobre la estructura de los datos, la forma en que se distribuyen, lo que es importante. Con esta información, puede comenzar a hacer inferencias sobre los datos. Por ejemplo, en el primer conjunto de datos, se podía determinar si un punto en particular estaba significativamente más alto sobre el nivel del mar que todos los demás, es decir, si representaba una anomalía estadística que valía la pena investigar, en función de cuántas desviaciones estándar de la media se encontraba.

Un punto a aclarar es que el concepto de desviación estándar no se limita a los datos distribuidos normalmente. Es un concepto general que se aplica a los datos que surgen de any distribución. Lo que tiene de especial la desviación estándar de la distribución normal es que se puede aplicar simétricamente con respecto a la media, ya que la normal es una distribución simétrica. Aunque otras distribuciones, como F, T, Chi-cuadrado, Gamma o Beta no son consistentemente simétricas, una varianza, y por lo tanto una desviación estándar, aún se puede calcular para ellos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *