rueki
5. 수치형 자료 정리 본문
728x90
반응형
수치자료를 표로 나타나기 위해서는 범주화가 필요하다.
수치 자료에 대해 도수분포표를 나타내려면 아래와 같은 작업이 필요하다.
- 자료 값이 한정된 경우, 값을 범주로 처리
- 자료 범주화 후, 도수 분포표 작성
- 도수, 누적도수, 상대 누적 도수 포함
여기서 범주화라 함은 계급의 수와 경계 값을 결정하는 것인데,
계급(Class) : 범주화를 시킨 것
계급의 수 : 제곱근, Struges, Rice 공식 등을 통해 결정
그러나 자료의 특성을 고려해 분석자가 결정하는 것이 제일 좋음
계급의 경계 : 동일 간격으로 정하는 것이 제일 좋다
자료의 구조와 설명을 고려해서 선택하며,
한 계급의 크기를 얼마로 할지를 정하는 것도 중요하다.
ex) 최소 7, 최대 34인 구간에서 3개의 계급으로 나누기
(34 - 7) / 3 = 9
-> [7, 16) , [16, 25), [25, 34]
데이터가 많을 때는 , 그 속에서 데이터가 많은 구간을 나타내는 곳을 세밀하게 쪼개는 것이 좋다.
ex)
연간 소득에 대한 분석
① 동일한 간격
② 1.5천만미만, [1.5천만, 3천만), [3천만, 5천만), [5천만, 7.5천만), [7.5천만, 1억), 1억 이상
그래프를 통한 수치형 자료 정리
1) 점도표 : 각 관측값의 위치에 점을 표시, 관측값이 있는 경우 위로 누적시킨다.
2) 히스토그램 : 수치자료 특히 연속자료의 분포형태를 표시
전체 면적 : 1
높이 : 상대도수 / 계급 구간 길이 = 밀도(Density)
728x90
반응형
'기초통계학' 카테고리의 다른 글
6. 수치 자료의 평균 (0) | 2020.04.05 |
---|---|
4. 범주형 자료 정리 (0) | 2020.03.10 |
3. 자료의 분류와 특성 (0) | 2020.03.09 |
2. 표본 추출 (0) | 2020.03.04 |
1. 모집단과 표본 (0) | 2020.03.01 |
Comments