R Studio 통계

확률 변수(random variable) 와 확률 분포(probability distribution)

헛소리뱅크 2023. 4. 28. 01:20
728x90
반응형

확률 변수(random variable)

확률변수란, 어떤 확률적인 사건에서 발생한 결과값을 숫자로 나타내는 변수를 말합니다.

어떤 실험을 수행할 때, 가능한 결과들이 미리 정해져 있지만 그 중에서 어떤 결과가 실제로 나올지는 불확실한 현상을 의미합니다. 예를 들어, 주사위를 던지는 경우, 주사위의 각 면이 나올 확률은 1/6이며, 이를 이용하여 주사위를 던졌을 때 특정한 눈이 나올 확률을 계산할 수 있습니다.

 

확률 변수의 간단한 예제

예를들어, 도시에서 차량 사고가 발생하는 경우를 생각해보자. 

이 경우, 차량 사고가 발생하는 횟수가 확률 변수가 됩니다. 확률 변수 X를 이용하여 "하루에 발생하는 차량 사고의 수"를 나타낼 수 있습니다. 확률 변수 X가 가질 수 있는 값은 0, 1, 2, 3, ...과 같은 자연수입니다.

즉, 하루에 발생하는 차량 사고가 2번일 확률을 나타내면 P(X=2)로 표기할 수 있습니다.


확률 분포(probability distribution)

확률분포란 확률 변수가 가질 수 있는 모든 값에 대해 그 값이 나타날 확률을 지정합니다.

확률 분포는 이산 확률 분포연속 확률 분포로 나뉘어집니다.


- 이산확률 분포 Discrete probability distribution

이산확률 분포는 이산적인 (Discrete) 값으로 이루어진 확률 변수의 분포를 뜻한다. 이산적인 값이란, 정수와 같이 셀 수 있는 값들을 뜻한다.  예를들어, 동전을 던지는 경우 앞면과 뒷면으로 나눌 수 있고, 주사위를 던지는 경우 1,2,3,4,5,6의 값 중 하나가 나오게 됩니다. 이러한 경우, 확률 변수는 정수값을 가지며, 이를 이산 확률 변수(discrete random variable)라고 합니다.

 

이산확률분포는 각각의 값에 대한 확률을 표현하는 확률 질량 함수(probability mass function)로 나타낼 수 있습니다.

 

확률 질량 함수 probability mass function (pmf)

확률 질량 함수는 확률 변수가 각 값에 대해 취할 수 있는 확률을 나타내며, f(x)= P(X=x)와 같이 표기합니다.

 

이산 확률 분포의 종류

  1. 이항분포(binomial Distribution)
  2. 포이슨 분포(Poisson distribution)
  3. 베르누이 분포 (Bernoulli Distribution)
  4. 초기하 분포( Hypergeometric Distribution)
  5. 기하 분포 (Geometric Distribution)


 

 

- 연속 확률 분포 (continuous probability distribution)

연속확률분포(Continuous Probability Distribution)는 연속적인 값으로 이루어진 확률 변수의 분포를 뜻합니다. 연속적인 값이란, 실수와 같이 무한개의 값이 있는(continuous) 값을 뜻합니다. 예를 들어, 확률변수 X를 중학교 1학년 학생의 평균 키라고 했을 때, X는 키이므로 실수값을 가지며 이는 ‘셀 수 없는’ 경우에 해당합니다. 따라서 이 경우 확률변수 X는 연속확률변수에 해당한다고 할 수 있습니다.

 

연속확률분포는 확률 밀도 함수(probability density function, PDF)를 사용하여 나타낼 수 있습니다.

 

 확률 밀도 함수(probability density function, PDF)

연속확률변수에서 특정 값을 가질 확률은 0이며, 구간 내에 해당 값이 포함될 확률을 계산합니다. 이러한 특징 때문에, 연속확률분포에서는 특정 값이 아닌 구간에 대한 확률을 계산하게 됩니다.

 

연속 확률 분포의 종류

     1. 정규분포(Normal Distribution)

     2. 감마분포(Gamma Distribution)

     3. 지수분포(Exponential Distribution)

    4. 카이제곱분포( Chi- squared Distribution)

    5.베타분포( Beta Distribution)

    6. 균일분포(Uniform Distribution)

 

 

반응형