rueki
4. 범주형 자료 정리 본문
범주형 자료는 Categorical Data 라고 하며, 각 범주에 몇 개의 관측개체가 있는지를 나타낸다.
범주를 나타내는 데이터를 정리하는 데 있어서, 도수 분포표를 통하여 정리를 한다.
도수 (Frequency)
: 범주에 속한 값(관측 개체)의 개수를 나타내며, 흔히 빈도 수라고도 한다.
상대 도수(Relative Frequency) = 상대 비율
: 상대적으로 얼마나 차지하고 있는지 해당 범주에 속한 비율을 나타낸다.
=> (해당 범주의 관측 개체 수 / 전체 관측 개체 수) x 100%
ex) 파이의 전체 판매 개수는 234개이다. 이 중에서 애플파이는 59개, 딸기파이는 52개를 팔았을 때,
애플파이의 상대도수 : 59/234 = 0.252 -> 0.252 x 100 = 25.2 %
딸기파이의 상대도수 : 52/234 = 0.222 -> 0.222 x 100 = 22.2 %
이를 도수 분포표로 간략하게 나타내보자.
종류 | 판매량 | 판매 비율 |
애플 | 59 | 25.2 |
딸기 | 52 | 22.2 |
ex) 학점에 관한 도수 분포표
A+ | 3 | 4.8 | 3 |
A | 6 | 9.7 | 9 |
B+ | 16 | 19.4 | 21 |
B | 16 | 25.8 | 37 |
합 | 62 | 100 | 62 |
표의 칼럼 순서로는 학점, 인원, 비율, 누적 인원 순이다.
여기서 학점은 A+에서 B 순서로 범주형 자료에 순서형 자료의 성질을 띄고 있다.
즉, 범주가 한 방향의 특성을 나타낸다고 볼 수가 있다.
위의 표에서 도수는 총 인원 62명을 나타낸다.
누적인원은 예를 들어 A+에서 A의 학생수는 총 9명 => A+ 3명, A 6명 = 9 이렇게 볼 수 있다.
위와 같이 표로 범주형 자료를 정리할 수 있고, 다른 방법은 그래프를 이용한 자료 정리이다.
그래프를 통해 시각적 방법을 이용하고, 데이터의 성질을 파악하기가 쉽다.
크게 많이 사용하는 것이 Pie chart, Bar Chart, 즉 원형 그래프와 막대 그래프가 있다.


두 가지 시각화 방법을 통해서 자료를 정리할 수가 있다.
원형 그래프는 범주에 해당하는 비율만큼 각도 분할하여 표시를 하며,
데이터를 정리하고 얼마나 많이 차지하는지 비교가 가능하다.
그러나 비교목적으로는 Bar Chart가 효율적인데, 이는 각 범주의 도수나 상대도수를 막대의 길이로 표시함에 따라
동일 척도에서의 위치 비교가 가능하기 때문이다.
'기초통계학' 카테고리의 다른 글
6. 수치 자료의 평균 (0) | 2020.04.05 |
---|---|
5. 수치형 자료 정리 (0) | 2020.03.11 |
3. 자료의 분류와 특성 (0) | 2020.03.09 |
2. 표본 추출 (0) | 2020.03.04 |
1. 모집단과 표본 (0) | 2020.03.01 |