표준 편차와 정확도의 관계는 무엇입니까?


우수 답변

다음과 같은 몇 가지 간단한 예를 통해 질문에 가장 잘 답변 할 수 있습니다. 가장 일반적인 통계 질문은 “측정되거나 계산 된 항목의 가치가 얼마나 정확한지”입니다. 정규 분포 (공식적으로 가우시안 분포라고 함)에서 1 표준 값의 확률입니다. 평균으로부터의 편차 (즉, 시그마 1 개)는 5 \%이고, 값 3 시그마가 평균으로부터의 확률은 1 \%입니다. 따라서 시그마를 알면 계산 된 값의 정확도를 즉시 추정 할 수 있습니다. 광범위한 시그마에 대한 오류 확률을 나열하는 표준 통계 테이블입니다.

답변

매튜의 답변은 제가 여기서 읽은 것 중 최고입니다. 저는 약간 더 간단한 접근 방식을 시도 할 것입니다. 수학 / 통계에 익숙하지 않은 사람들을 위해 컨텍스트를 추가하기를 바랍니다.

샘플의 표준 편차가 그것보다 더 큰 것입니다. 평균은 조사중인 데이터에 따라 다른 것을 나타낼 수 있습니다.

Matthew가 말했듯이 평균은 실제로 위치에 대한 설명입니다. 이것은 데이터의 일종의 “질량 중심”이라고 생각할 수 있습니다.

표준 편차는 데이터의 산포, 평균에 대해 얼마나 널리 분포되어 있는지에 대한 설명입니다. 표준 편차가 작을수록 더 많은 데이터가 평균에 대해 군집되어 있음을 나타냅니다. 값이 클수록 데이터가 더 많이 분산되어 있음을 나타냅니다.

표준 편차를 평균과 비교하면 작업중인 데이터에 따라 다른 것을 알 수 있습니다. 예를 들어 데이터가 해수면 위와 아래에서 측정 된 거리를 나타낸다고 가정 해 보겠습니다. 이 경우 평균은 0 (해수면)이 될 수 있고 표준 편차는 20 피트가 될 수 있습니다. 이는 대부분의 측정 값이 해수면 위 20 피트 및 아래 20 피트 내에 있음을 나타냅니다. 반면에 데이터가 Palm Beach 콘도 거주자의 연령을 나타내면 어떻게 될까요? 이 경우 평균은 85이고 표준 편차는 10이 될 수 있습니다. 이는 대부분의 거주자가 75 세에서 95 세 사이에 있음을 나타냅니다.

첫 번째 경우 표준 편차가 더 큽니다. 평균보다. 두 번째 경우에는 더 작습니다. 하지만 궁극적으로 상대적인 크기는 거의 중요하지 않습니다. 데이터의 구조, 배포 방식에 대해 알려주는 것이 중요합니다.이 정보를 사용하여 데이터에 대한 추론을 시작할 수 있습니다. 예를 들어, 첫 번째 데이터 세트에서 특정 지점이 다른 모든 지점보다 해발보다 훨씬 더 높은지 여부를 확인할 수 있습니다. 즉, 조사 할 가치가있는 통계적 이상을 나타내는 지 여부는 해당 지점이 위치한 평균에서 얼마나 많은 표준 편차를 벗어 났는지에 따라 결정됩니다.

한 가지 명확히해야 할 점은 표준 편차의 개념이 정규 분포 데이터에 국한되지 않는다는 것입니다. any <에서 발생하는 데이터에 적용되는 일반적인 개념입니다. / span> 분포. 정규 분포의 표준 편차가 특별한 점은 정규 분포가 대칭 분포이기 때문에 평균에 대해 대칭 적으로 적용 할 수 있다는 점입니다. F, T, 카이 제곱과 같은 다른 분포는 감마 또는 베타, 일관되게 대칭이 아니므로 분산 (따라서 표준 편차)을 계산할 수 있습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다