rueki

5. 수치형 자료 정리 본문

기초통계학

5. 수치형 자료 정리

륵기 2020. 3. 11. 18:41
728x90
반응형

수치자료를 표로 나타나기 위해서는 범주화가 필요하다.

 

수치 자료에 대해 도수분포표를 나타내려면 아래와 같은 작업이 필요하다.

  • 자료 값이 한정된 경우, 값을 범주로 처리
  • 자료 범주화 후, 도수 분포표 작성
  • 도수, 누적도수, 상대 누적 도수 포함

 

여기서 범주화라 함은 계급의 수와 경계 값을 결정하는 것인데,

계급(Class) : 범주화를 시킨 것

계급의 수 : 제곱근, Struges, Rice 공식 등을 통해 결정

               그러나 자료의 특성을 고려해 분석자가 결정하는 것이 제일 좋음

 

계급의 경계 : 동일 간격으로 정하는 것이 제일 좋다

                  자료의 구조와 설명을 고려해서 선택하며,

                  한 계급의 크기를 얼마로 할지를 정하는 것도 중요하다.

 

ex) 최소 7, 최대 34인 구간에서 3개의 계급으로 나누기

(34 - 7) / 3 = 9

-> [7, 16) , [16, 25), [25, 34]

 

데이터가 많을 때는 , 그 속에서 데이터가 많은 구간을 나타내는 곳을 세밀하게 쪼개는 것이 좋다.

 

ex)

연간 소득에 대한 분석

① 동일한 간격

② 1.5천만미만, [1.5천만, 3천만), [3천만, 5천만), [5천만, 7.5천만), [7.5천만, 1억), 1억 이상


그래프를 통한 수치형 자료 정리

1) 점도표 : 각 관측값의 위치에 점을 표시, 관측값이 있는 경우 위로 누적시킨다.

 

 

2) 히스토그램 : 수치자료 특히 연속자료의 분포형태를 표시

전체 면적 : 1

높이 : 상대도수 / 계급 구간 길이 = 밀도(Density)

728x90
반응형

'기초통계학' 카테고리의 다른 글

6. 수치 자료의 평균  (0) 2020.04.05
4. 범주형 자료 정리  (0) 2020.03.10
3. 자료의 분류와 특성  (0) 2020.03.09
2. 표본 추출  (0) 2020.03.04
1. 모집단과 표본  (0) 2020.03.01
Comments