R Studio 통계

데이터 분류(수치형 변수- 연속형, 이산형 & 범주형 변수 - 순서형, 명목형)

헛소리뱅크 2023. 5. 2. 14:46
728x90
반응형

Types of Variables  

데이터 분류를 위한 분류법 중 하나인 데이터 분류법(Taxonomy of Data)은 수치형 변수(numerical)범주형 변수(categorical)로 구분된다. 

수치형 변수 Numerical Variable  = Quantitative(양적변수)

숫자 값을 가지는 변수. 변수들은 수치적 의미가 있는 값들을 가집니다. 수치형 변수들은 "연속형 변수(Continuous Numerical Variable)"와 "이산형 변수 (Discrete Numerical Variable)"로 분류됩니다.

- 연속형 변수Continuous Numerical Variable

무한한 범위에서 값을 가질 수 있는 변수로, 예를 들어 키, 체중, 온도와 같은 값들이 이에 해당됩니다.

- 이산형 변수 Discrete Numerical Variable 

정수 형태의 값을 가지는 변수로, 예를 들어 가족 구성원 수나 학생 수와 같은 값들이 이에 해당됩니다.

범주형 변수 Categorical Variable = Qualitative(질적변수)

숫자 값 대신에 그룹이나 범주형 값을 가지는 변수들을 의미합니다. 모든 범주형 변수는 "순서형 변수 (Ordinal Categorical Variable)" 또는 "명목형 변수 (Nominal Categorical Variable)"  로 분류됩니다.

- 순서형 변수 Ordinal Categorical Variable

순서가 있는 범주형 변수로, 학력 수준과 같은 값이 이에 해당됩니다.  예를 들어, 우리가 높은 학위를 가진 사람이 일반적으로 낮은 학위를 가진 사람보다 높은 급여를 받을 것이라는 것을 예측할 수 있습니다. 이것은 범주 간에 순서가 있기 때문입니다.

- 명목형 변수 Nominal Categorical Variable

 순서가 없는 범주형 변수로, 성별이나 인종과 같은 값이 이에 해당됩니다. 예를 들어, 우리가 사람들의 선호도를 조사할 때, "좋아하는 색깔은 무엇입니까?"라는 질문에 대한 답변은 명목형 범주형 변수입니다. 이 경우 색깔은 순서가 없으며 서로 다른 색깔들은 서로 동등합니다. 따라서 명목형 범주형 변수는 단지 범주를 정의하는데 사용되며, 범주 간에는 어떤 순서도 없습니다.
 

 

 

반응형