rueki

4. 범주형 자료 정리 본문

기초통계학

4. 범주형 자료 정리

륵기 2020. 3. 10. 13:30
728x90
반응형

범주형 자료는 Categorical Data 라고 하며, 각 범주에 몇 개의  관측개체가 있는지를 나타낸다.

범주를 나타내는 데이터를 정리하는 데 있어서, 도수 분포표를 통하여 정리를 한다.

 

 

도수 (Frequency)

: 범주에 속한 값(관측 개체)의 개수를 나타내며, 흔히 빈도 수라고도 한다.

 

상대 도수(Relative Frequency) = 상대 비율

: 상대적으로 얼마나 차지하고 있는지 해당 범주에 속한 비율을 나타낸다.

 

=> (해당 범주의 관측 개체 수 / 전체 관측 개체 수) x 100%

 

 

ex) 파이의 전체 판매 개수는 234개이다. 이 중에서 애플파이는 59개, 딸기파이는 52개를 팔았을 때,

 

애플파이의 상대도수 : 59/234 = 0.252 -> 0.252 x 100 = 25.2 %

딸기파이의 상대도수 : 52/234 = 0.222 -> 0.222 x 100 = 22.2 %

 

이를 도수 분포표로 간략하게 나타내보자.

 

종류 판매량 판매 비율
애플 59 25.2
딸기 52 22.2

 

ex) 학점에 관한 도수 분포표

A+ 3 4.8 3
A 6 9.7 9
B+ 16 19.4 21
B 16 25.8 37
 
62 100 62

표의 칼럼 순서로는 학점, 인원, 비율, 누적 인원 순이다.

여기서 학점은 A+에서 B 순서로 범주형 자료에 순서형 자료의 성질을 띄고 있다.

즉, 범주가 한 방향의 특성을 나타낸다고 볼 수가 있다.

위의 표에서 도수는 총 인원 62명을 나타낸다.

누적인원은 예를 들어 A+에서 A의 학생수는 총 9명 => A+ 3명, A 6명 = 9 이렇게 볼 수 있다.

 

위와 같이 표로 범주형 자료를 정리할 수 있고, 다른 방법은 그래프를 이용한 자료 정리이다.

그래프를 통해 시각적 방법을 이용하고, 데이터의 성질을 파악하기가 쉽다.

 

크게 많이 사용하는 것이 Pie chart, Bar Chart, 즉 원형 그래프와 막대 그래프가 있다.

 

Pie Chart
bar chart

두 가지 시각화 방법을 통해서 자료를 정리할 수가 있다.

원형 그래프는 범주에 해당하는 비율만큼 각도 분할하여 표시를 하며,

데이터를 정리하고 얼마나 많이 차지하는지 비교가 가능하다.

 

그러나 비교목적으로는 Bar Chart가 효율적인데, 이는 각 범주의 도수나 상대도수를 막대의 길이로 표시함에 따라

동일 척도에서의 위치 비교가 가능하기 때문이다.

728x90
반응형

'기초통계학' 카테고리의 다른 글

6. 수치 자료의 평균  (0) 2020.04.05
5. 수치형 자료 정리  (0) 2020.03.11
3. 자료의 분류와 특성  (0) 2020.03.09
2. 표본 추출  (0) 2020.03.04
1. 모집단과 표본  (0) 2020.03.01
Comments