rueki

3. 자료의 분류와 특성 본문

기초통계학

3. 자료의 분류와 특성

륵기 2020. 3. 9. 23:52
728x90
반응형

통계학에서는 분석목적, 자료 형태에 따라 다양한 분석 방법을 제공한다.

분석 방법의 적절성을 설명하기 위해서는, 분석하고자 하는 자료가 해당 방법에서 가정했던 조건들을 얼마나 만족하는지를 나타내야 한다. 즉, 자료의 속성데 따른 분류가 필요하게 되는 것이다.

 

번호 연령 신장 체중 비만도 혈액형 충치
1 25 181 75 정상 B 5
2 23 175 75 과체중 A 1
3 19 161 48 정상 A 4
4 23 178 67 정상 A 2

 

위와 같은 표를 흔히 데이터 셋이라 하며, 변수라고도 일컫을 수가 있다.

 

변수의 종류

  • 일변량 자료 : 하나의 변수만 있는 자료
  • 다변량 자료 : 여러개의 변수로 이루어진 자료 -> 변수들간의 관련성이 중요하다.
  • ex) 성 <=> 체중 -> 연관 x / 신장 <=> 체중 -> 관련 있음

관측 개체 (Observation) : 관측개체들 간 관련성 유무

 


자료 - 범주형 - 명목형 / 자료형

       - 수치형 - 이산형 / 연속형

 

  • 명목형 자료 (Nomial Data)

-> 숫자로 바꾸어도 값이 크고, 작음을 나타내니 않는 형태, 단순히 범주만 표시를 한다.

ex) 혈액형, 성별(주민번호 뒷자리-> 1,3/2,4)

 

  • 순서형 자료(Ordinal)

-> 범주의 순서가 상대 비교가 가능함

ex) 비만도 (저체중, 정상, 과체중, 비만 ...)

     학점 (A,B,C,D,E)

                    

  • 이산형 자료(Discrete)

-> 셀 수 있는 형태 (Countable Data)

ex) 교통사고 건수, 자료의 수

범주형 자료 발생 빈도를 나타냄 -> 범주형 자료 분석에 사용될 수 있음

 

  • 연속형 자료(Continuous)

ex) 신장, 체중, 시간...

(몸무게 64.5 ~ 65.5는 65로 표현이 가능함)

연속형 변수를 이산화로 함에따라 절제된 형태로 출력

728x90
반응형

'기초통계학' 카테고리의 다른 글

6. 수치 자료의 평균  (0) 2020.04.05
5. 수치형 자료 정리  (0) 2020.03.11
4. 범주형 자료 정리  (0) 2020.03.10
2. 표본 추출  (0) 2020.03.04
1. 모집단과 표본  (0) 2020.03.01
Comments