● 산포도의 개념 자료가 중심에서 얼마나 떨어져 있는가(산포도)를 측정하는 측도로 가장 많이 사용되는 것이 분산(variance)입니다.
산포도의 개념을 다음 자료를 이용하여 설명해 보겠습니다. 다음은 어떤 두 집단의 통계학 성적이라고 가정합니다.
- A반 : 20, 80, 60, 100, 40, 90, 50, 70, 30 - B반 : 56, 53, 61, 58, 64, 63, 60, 59, 66
앞의 점수를 각 순서대로 좌표로 도식화하면 아래와 같습니다.

이 두 집단의 평균은 모두 60점이지만 A반 학생들의 점수는 매우 다양한 반면, B반 학생들의 점수는 거의 엇비슷합니다. 다시 말해서 점과 수평직선(평균)을 잇는 수직직선(거리)의 길이가 A는 길고, B는 짧습니다. (A가 B에 비해 중심에서 넓게 퍼져 있습니다.) 평균에 집중 또는 산재되어 있는 정도를 산포도(dispersion)라 하고, 데이터와 평균간의 거리를 이용해 그를 표현할 수 있습니다.
● 표본편차 표준편차는 자료의 분산도 중 가장 많이 사용되고 있는 방법으로, 각각의 자료와 산술평균과의 편차의 제곱에 대한 산술 평균의 제곱근을 말합니다.

● 분산 분산은 표준편차를 제곱한 값입니다.
|