Qual é a relação entre desvio padrão e precisão?


Melhor resposta

A pergunta pode ser melhor respondida por alguns exemplos simples como segue. A pergunta estatística mais comum é “quão preciso é o valor de algo que foi medido ou contado”. Em uma distribuição normal (formalmente chamada de distribuição Gaussiana), a probabilidade de um valor que seja um padrão. o desvio da média (isto é, um sigma) é 5\% e a probabilidade de um valor 3 sigma da média é 1\%. Assim, conhecer o sigma permite uma estimativa imediata da precisão do valor calculado. Essa é uma tabela estatística padrão que lista a probabilidade de erro versus sigma em uma ampla faixa.

Resposta

A resposta de Matthew é realmente a melhor que li aqui. Vou tentar uma abordagem um pouco mais simples, espero adicionar algum contexto para aqueles que não são tão versados ​​em matemática / estatísticas.

O desvio padrão de uma amostra é de magnitude maior do que seu média pode indicar coisas diferentes, dependendo dos dados que você está examinando.

A média, como Matthew afirmou, é na verdade uma descrição da localização. Pode ser pensado como uma espécie de “centro de massa” de seus dados.

O desvio padrão é uma descrição da distribuição dos dados, com que amplitude eles estão distribuídos em torno da média. Um desvio padrão menor indica que mais dados estão agrupados em torno da média. Um maior indica que os dados estão mais espalhados.

Comparar o desvio padrão com a média dirá coisas diferentes dependendo dos dados com os quais você está trabalhando. Por exemplo, digamos que seus dados representem distâncias medidas acima e abaixo do nível do mar. Sua média neste caso pode ser zero – nível do mar – e seu desvio padrão pode ser 20 pés. Isso indicaria que a maioria de suas medições está dentro de 20 pés acima e 20 pés abaixo do nível do mar. Por outro lado, e se seus dados representassem a idade dos residentes em um condomínio em Palm Beach? Nesse caso, sua média pode ser 85 e seu desvio padrão pode ser 10, indicando que a maioria dos residentes tem entre 75 e 95 anos.

No primeiro caso, o desvio padrão é maior do que a média. No segundo caso, é menor. Mas, em última análise, seu tamanho relativo importa pouco – é o que eles dizem sobre a estrutura dos dados, a forma como são distribuídos, que é importante. Usando essas informações, você pode começar a fazer inferências sobre os dados. Por exemplo, No primeiro conjunto de dados, você pode determinar se um determinado ponto estava significativamente mais alto acima do nível do mar do que todos os outros – ou seja, se representava uma anomalia estatística que valesse a pena investigar – com base em quantos desvios padrão da média em que foi localizado.

Um ponto a esclarecer é que o conceito de desvio padrão não se limita a dados normalmente distribuídos. É um conceito geral que se aplica a dados que surgem de qualquer distribuição. O que é especial sobre o desvio padrão para a distribuição normal é que ele pode ser aplicado simetricamente sobre a média, uma vez que o normal é uma distribuição simétrica. Embora outras distribuições, como F, T, Qui-quadrado, Gama, ou Beta, não são consistentemente simétricos, uma variância – e, portanto, um desvio padrão – ainda pode ser calculada para eles.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *