728x90
반응형
Qualitative (질적 변수)
Bar graph( Bar chart)
Qualitative (질적 변수): Categorical 일때 사용 -Norminal(명목형 ) 일때 사용
- 예를 들어, 어떤 도시에서 각 음식점의 종류(한식, 중식, 양식 등)를 비교할 때, 각 카테고리(음식점 종류)를 x축에, 그리고 각 카테고리별 개수(빈도)를 y축에 나타내는 막대 그래프를 그릴 수 있다.
Pie Chart
Qualitative (질적 변수): Categorical 일때 사용 -Norminal(명목형 ) 일때 사용
- 예를 들어, 전체 학생 중 남학생과 여학생의 비율을 Pie chart로 시각화할 수 있습니다.
Quantitative (양적변수)
Bar Plot
Quantitative (양적변수) :Numerical 일 때 사용 - Discrete (비 연속형 ) 일때 사용
- 예를 들어, 연도별 매출액과 같은 데이터가 있을 때, 각 연도별 매출액의 평균값을 Bar plot으로 시각화할 수 있습니다.
- Continuous(연속형)이면서 범주가 많은 경우에는 Histogram 또는 Density plot과 같은 다른 시각화 방법을 고려해야함.
Line graph
Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형 ) 일때 사용
- 데이터의 변화를 시간에 따라 또는 순서에 따라 추적하는 데 적합합니다. 따라서 시계열 데이터나 순서에 따른 데이터의 변화를 보여주는 경우에 많이 사용됩니다.
- 예를 들어, 일일 매출, 주식 가격, 기온 변화, 운동 성과 등을 보여주는 데 사용할 수 있습니다. 또한, 데이터의 추세, 패턴, 주기성 등을 파악하는 데도 유용합니다.
Histogram
Quantitative (양적변수) :Numerical 일 때 사용 - Continuous (연속형 )일 때 사용
Violin plot
Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용
- Histogram과 밀도 그래프를 결합한 것으로, 데이터의 분포를 더 자세하게 파악할 수 있도록 도와줍니다.
- 특히 데이터가 많고 개별 관찰을 표시 할 수 없는 경우에 적합
- 각 종의 부리 길이 분포는 종종 바이올린처럼 보이는 모양으로 표현되지만 실제로는 x축을 중심으로 반영된 단순한 밀도 곡선입니다.
- 박스 플롯(Box plot)과 유사하게, 데이터의 중심 경향성, 산포도, 비대칭성, 이상치 등을 파악하는 데 유용합니다
Box plot
Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용
- Box plot은 데이터의 중심 경향성, 산포도, 비대칭성, 이상치 등을 파악하는 데 유용합니다.
- 여러 그룹 간의 데이터 분포를 비교하는 데도 사용할 수 있습니다.
- Box plot은 전체 데이터 분포를 5개의 요약 통계량(최소값, 제1사분위수, 중앙값, 제3사분위수, 최대값)으로 나타내며, 이를 통해 데이터의 분포 형태를 파악할 수 있습니다.
Density plots
Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용
Dot Plot
Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용
- Dot plot은 데이터셋이 작은 경우 분포의 형태와 이상치(outlier) 등을 파악하기 쉽게 하므로, 특히 히스토그램이나 밀도 그래프 등의 분포 시각화 방법과 함께 많이 사용됩니다.
- 데이터가 적은 경우에는 각 점의 위치를 파악하기 용이하여 정보 전달에 용이합니다.
- 또한, 다른 그래프에 비해 시각적인 간결함과 직관성이 뛰어나므로 데이터 분포를 빠르게 파악하는 데 유용합니다.

2023.05.02 - [R Studio 통계] - 데이터 분류(수치형 변수- 연속형, 이산형 & 범주형 변수 - 순서형, 명목형)
반응형
'R Studio 통계' 카테고리의 다른 글
통계학의 기본 개념: 모집단 분포, 확률 분포, 경험적 분포, 표본 분포, 측정분포 (0) | 2023.05.03 |
---|---|
Sources of Error 오류의 원인- Types of Statistical Bias, Types of Variation- (selection, measurement ) (0) | 2023.05.03 |
데이터 분류(수치형 변수- 연속형, 이산형 & 범주형 변수 - 순서형, 명목형) (0) | 2023.05.02 |
확률 변수(random variable) 와 확률 분포(probability distribution) (0) | 2023.04.28 |