Population Distribution 모집단 분포
모집단(population)은 조사하고자 하는 전체 집단을 의미합니다. 모집단 분포는 이러한 모집단의 전체 데이터를 나타내는 확률 분포입니다. 모집단 분포를 알면, 해당 모집단에서 랜덤하게 추출한 샘플의 특성을 예측할 수 있습니다.
예를 들어, 어떤 도시의 모든 주민의 키를 측정하여 히스토그램으로 나타내면, 이것이 모집단 분포입니다. 이 모집단 분포를 이용하여, 도시 주민들의 평균 키, 분산, 중앙값 등의 통계적 특성을 추정할 수 있습니다.
Empirical Distribution 경험적 분포
경험적 분포는 실제 데이터에서 추출한 빈도수를 이용하여 분포를 나타낸 것입니다. 이를 통해 데이터의 분포를 시각화하고, 이를 통해 데이터의 특성을 파악할 수 있습니다.
경험적 분포는 주로 모집단의 분포가 어떤 형태인지 모를 때, 또는 모집단 분포가 특정한 분포를 따르지 않는 경우에 사용됩니다.
예를 들어, 어떤 제품의 제조 공정에서 생산된 제품의 무게를 조사하고, 이 데이터를 이용하여 경험적 분포를 생성하면, 이를 통해 생산된 제품의 평균 무게, 분산, 중앙값 등을 추정할 수 있습니다. 또한, 경험적 분포를 이용하여 생산된 제품의 무게가 일정 범위 내에 있는 확률을 계산하거나, 이 분포와 다른 분포 간의 차이를 비교하는 등의 분석도 가능합니다.
Sampling Distribution 표본 분포
표본 분포는 동일한 크기의 여러 표본을 추출할 때, 각 표본에서 구한 통계량의 분포를 나타내는 것입니다. 예를 들어, 100명의 사람들 중에서 10명을 무작위로 추출하여 그들의 키를 측정하는 것을 여러 번 반복하면, 이들 표본에서 추출한 키의 평균이 어떻게 분포되어 있는지를 나타내는 것입니다.
예를 들어, 어떤 도시의 모든 주민의 키를 모두 측정하여 모집단 분포를 알고 있다고 가정해봅시다. 이때, 동일한 크기의 표본을 여러 번 추출하여 각 표본의 평균을 구하면, 이들 평균값들의 분포가 모집단 평균값과 비슷한 모양을 가지는 것이 관측됩니다. 이 분포는 중심극한정리(Central Limit Theorem)에 의해 정규분포에 근사합니다.
Probability Distribution 확률 분포
2023.04.28 - [R Studio 통계] - 확률 변수(random variable) 와 확률 분포(probability distribution)
Measurement Distribtion 측정 분포
측정 분포는 모집단이나 표본에서 측정된 변수의 값들이 나타내는 분포를 의미합니다. 예를 들어, 사람들의 키를 측정하여 분포를 보면 키가 어떻게 분포되어 있는지를 알 수 있습니다. 이 분포는 일반적으로 정규 분포, 왜곡된 분포, 이항 분포 등 다양한 형태를 가질 수 있습니다.
모집단 분포는 모집단의 전체 데이터를 나타내는 확률 분포를 나타내고,
표본 분포는 추출된 통계량의 분포를 나타내고,
경험적 분포는 실제 데이터에서 추출한 빈도수를 이용하여 분포를 나타내고,
측정 분포는 변수 값들의 분포를 나타냅니다.
'R Studio 통계' 카테고리의 다른 글
Sources of Error 오류의 원인- Types of Statistical Bias, Types of Variation- (selection, measurement ) (0) | 2023.05.03 |
---|---|
그래프의 종류 - 쓰임 (0) | 2023.05.03 |
데이터 분류(수치형 변수- 연속형, 이산형 & 범주형 변수 - 순서형, 명목형) (0) | 2023.05.02 |
확률 변수(random variable) 와 확률 분포(probability distribution) (0) | 2023.04.28 |
데이터 (0) | 2023.04.25 |