특정치에 의한 자료의 분석
1. 중심화 경향(Central tendency)
측정치들이 집중되어 있는 위치를 나타내는 것으로 평균, 중앙값, 최빈값 등을 사용한다.
5) 기하평균
- 산술평균을 대표치로 사용할 수 없는 또 다른 예
- 연간 물가 상승률, 경제 성장률, 인구 증가율ㅡ> 단위 기간당 평균 변화율
- 수치의 변화가 기하급수적으로 또는 등비수열적으로 변하는 상황에서 대표치 역할
예제) 우리나라의 1981년~1991년의 소매물가지수는 다음 표와 같다.
4) 조화평균
연도 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
물가지수 86.2 92.3 95.4 97.6 100 102.8 105.9 113.4 119.9 130.2 142.8
1. 각 연도의 물가상승률을 구하라.
2. 1981년부터 1991년의 10년간 연평균 물가상승률을 구하라.
3) 산술 평균
- 산술평균을 대표치로 사용하기에는 부적합하고 오히려 자료의 역수를 취하여 산술평균을 구한 후 그 값의 역수를 대표치로 사용하여야할 경우
2) 중앙값
- 가장 일반적으로 사용되는 대표치로 모집단 μ와 표본의 평균 X로 구분
1) 최빈값
예) K승용차의 휘발유 1l당 주행거리를 확인하고자 고속도로 100km와 도심지 100km를 시험 주행하였다. 그 결과 고속도로에서는 1l당 14km, 도심지에서는 1l당 10km를 달릴 수 있었다. 이 때 고속도로와 도심지 시험주행 전구간 200km에 대한 l당
평균주행거리를 구하라.
- 수치로 이루어진 자료들을 크기 순서대로 나열하였을 때 중앙에 위치한 관측치
- 자료를 동일한 규모의 두 집단으로 나누는 작업이 필요할 때 사용하기에 적당한 대표치
- 자료의 개수 n이 홀수; 중앙값은 (n+1)/2번째 위치의값
- 자료의 개수 n이 짝수; 중앙값은 가운데 값
- 가장 빈도가 많은 관측값
- 존재하지 않을 수도 있으며, 존재하는 경우에도 유일하지 않을 수도 있다.
- 대표치로써 단독으로 사용하기에는 문제가 있다 ㅡ> 빈도가 가장 높은 항목이나 수치가 전체 자료의 중심위치로부터 멀어질수록 그 항목은 중심위치를 대변할 수 없다.
- 대체로 평균이나 중앙값의 보조용으로 사용
(2) 산포도 (Degree of dispersion)
- 자료 분포의 퍼진 정도를 나타낸다.
- 산포도는 표준편차, 분산, 범위, 사분위 범위, 백분위 범위 등이 있다.
3) 분산과 표준편차
2) 평균 편차
1) 범위
- 관측치와 산술평균의 차이들의 절대값에 대한 평균값
- 평균편차를 계산할 때 편차의 절대값을 사용하는 까닭은 편차들의 평균이 0이 되기 때문 ㅡ>분산: 편차를 제곱한 값들의 평균
- 표준편차는 분산의 제곱근이다.
- 산포도의 가장 간단한 측정방법
- 자료 중 가장 큰 값과 작은 값의 절대적 차이
- *중간범위(Mid-range): 범위가 극단적인 수치의 영향을 받아 적절한 산포도의 측정 방안으로 한계가 있으므로 이를 다소 수정한 산포도의 개념
- 주로 많이 쓰이는 중간범위로는 중간 부분 80% 또는50%이다.
(3) 분포도
- 분포도는 분포의 모양을 나타내는 것
- 자료의 대표치와 산포도가 측정되면 이러한 특성치들을 통하여 자료의 특징을 파악할 수 있다.
- 자료의 분포되어 있는 모양을 묘사하는 방법에 따라서 왜도와 첨도가 구분된다.
1) 왜도
- 자료분포의 치우친 정도
- 분포의 비대칭 정도를 나타내는 척도
- 왜도 값이 음이면 자료집단의 분포는 왼쪽으로 긴 꼬리를 갖고, 양이면 자료집단의 분포는 오른쪽으로 긴 꼬리를 갖는다.
2) 첨도
- 분포의 모양이 얼마나 뾰족한가를 나타내는 정도
- 분포의 모양이 뾰족할수록 분모의 값이 분자에 비하여 상대적으로 작다. ㅡ>첨도의 값이 커질수록 분포의 모양은 뾰족