Types of Variables
데이터 분류를 위한 분류법 중 하나인 데이터 분류법(Taxonomy of Data)은 수치형 변수(numerical) 와 범주형 변수(categorical)로 구분된다.
수치형 변수 Numerical Variable = Quantitative(양적변수)
숫자 값을 가지는 변수. 변수들은 수치적 의미가 있는 값들을 가집니다. 수치형 변수들은 "연속형 변수(Continuous Numerical Variable)"와 "이산형 변수 (Discrete Numerical Variable)"로 분류됩니다.
- 연속형 변수Continuous Numerical Variable
무한한 범위에서 값을 가질 수 있는 변수로, 예를 들어 키, 체중, 온도와 같은 값들이 이에 해당됩니다.
- 이산형 변수 Discrete Numerical Variable
정수 형태의 값을 가지는 변수로, 예를 들어 가족 구성원 수나 학생 수와 같은 값들이 이에 해당됩니다.
범주형 변수 Categorical Variable = Qualitative(질적변수)
숫자 값 대신에 그룹이나 범주형 값을 가지는 변수들을 의미합니다. 모든 범주형 변수는 "순서형 변수 (Ordinal Categorical Variable)" 또는 "명목형 변수 (Nominal Categorical Variable)" 로 분류됩니다.
- 순서형 변수 Ordinal Categorical Variable
순서가 있는 범주형 변수로, 학력 수준과 같은 값이 이에 해당됩니다. 예를 들어, 우리가 높은 학위를 가진 사람이 일반적으로 낮은 학위를 가진 사람보다 높은 급여를 받을 것이라는 것을 예측할 수 있습니다. 이것은 범주 간에 순서가 있기 때문입니다.
- 명목형 변수 Nominal Categorical Variable
순서가 없는 범주형 변수로, 성별이나 인종과 같은 값이 이에 해당됩니다. 예를 들어, 우리가 사람들의 선호도를 조사할 때, "좋아하는 색깔은 무엇입니까?"라는 질문에 대한 답변은 명목형 범주형 변수입니다. 이 경우 색깔은 순서가 없으며 서로 다른 색깔들은 서로 동등합니다. 따라서 명목형 범주형 변수는 단지 범주를 정의하는데 사용되며, 범주 간에는 어떤 순서도 없습니다.
'R Studio 통계' 카테고리의 다른 글
Sources of Error 오류의 원인- Types of Statistical Bias, Types of Variation- (selection, measurement ) (0) | 2023.05.03 |
---|---|
그래프의 종류 - 쓰임 (0) | 2023.05.03 |
확률 변수(random variable) 와 확률 분포(probability distribution) (0) | 2023.04.28 |
데이터 (0) | 2023.04.25 |
R Studio 배우기 (0) | 2023.04.25 |