R Studio 통계

그래프의 종류 - 쓰임

헛소리뱅크 2023. 5. 3. 02:27
728x90
반응형

Qualitative (질적 변수)

Bar graph( Bar chart)

Qualitative (질적 변수): Categorical 일때 사용 -Norminal(명목형 ) 일때 사용

 

  • 예를 들어, 어떤 도시에서 각 음식점의 종류(한식, 중식, 양식 등)를 비교할 때, 각 카테고리(음식점 종류)를 x축에, 그리고 각 카테고리별 개수(빈도)를 y축에 나타내는 막대 그래프를 그릴 수 있다. 

Pie Chart 

Qualitative (질적 변수): Categorical 일때 사용 -Norminal(명목형 ) 일때 사용

 

  • 예를 들어, 전체 학생 중 남학생과 여학생의 비율을 Pie chart로 시각화할 수 있습니다.

Quantitative (양적변수)

Bar Plot

Quantitative (양적변수) :Numerical 일 때 사용 - Discrete (비 연속형 ) 일때 사용   

 

  • 예를 들어, 연도별 매출액과 같은 데이터가 있을 때, 각 연도별 매출액의 평균값을 Bar plot으로 시각화할 수 있습니다.
  • Continuous(연속형)이면서 범주가 많은 경우에는 Histogram 또는 Density plot과 같은 다른 시각화 방법을 고려해야함. 

Line graph

Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형 ) 일때 사용

 

  • 데이터의 변화를 시간에 따라 또는 순서에 따라 추적하는 데 적합합니다. 따라서 시계열 데이터나 순서에 따른 데이터의 변화를 보여주는 경우에 많이 사용됩니다. 
  • 예를 들어, 일일 매출, 주식 가격, 기온 변화, 운동 성과 등을 보여주는 데 사용할 수 있습니다. 또한, 데이터의 추세, 패턴, 주기성 등을 파악하는 데도 유용합니다.

Histogram

Quantitative (양적변수) :Numerical 일 때 사용 - Continuous (연속형 )일 때 사용

Violin plot

Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용         

                        

  •  Histogram과 밀도 그래프를 결합한 것으로, 데이터의 분포를 더 자세하게 파악할 수 있도록 도와줍니다. 
  • 특히 데이터가 많고 개별 관찰을 표시 할 수 없는 경우에 적합
  • 각 종의 부리 길이 분포는 종종 바이올린처럼 보이는 모양으로 표현되지만 실제로는 x축을 중심으로 반영된 단순한 밀도 곡선입니다.
  • 박스 플롯(Box plot)과 유사하게, 데이터의 중심 경향성, 산포도, 비대칭성, 이상치 등을 파악하는 데 유용합니다

Box plot

Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용

 

  • Box plot은 데이터의 중심 경향성, 산포도, 비대칭성, 이상치 등을 파악하는 데 유용합니다.  
  • 여러 그룹 간의 데이터 분포를 비교하는 데도 사용할 수 있습니다.
  •  Box plot은 전체 데이터 분포를 5개의 요약 통계량(최소값, 제1사분위수, 중앙값, 제3사분위수, 최대값)으로 나타내며, 이를 통해 데이터의 분포 형태를 파악할 수 있습니다.

Density plots 

Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용

Dot Plot

Quantitative (양적변수) : Numerical 일 때 사용 - Continuous (연속형) 일때 사용

 

  • Dot plot은 데이터셋이 작은 경우 분포의 형태와 이상치(outlier) 등을 파악하기 쉽게 하므로, 특히 히스토그램이나 밀도 그래프 등의 분포 시각화 방법과 함께 많이 사용됩니다.
  •  데이터가 적은 경우에는 각 점의 위치를 파악하기 용이하여 정보 전달에 용이합니다.
  •  또한, 다른 그래프에 비해 시각적인 간결함과 직관성이 뛰어나므로 데이터 분포를 빠르게 파악하는 데 유용합니다.


2023.05.02 - [R Studio 통계] - 데이터 분류(수치형 변수- 연속형, 이산형 & 범주형 변수 - 순서형, 명목형)

반응형