[생각보다 쉬운 통계학] 2. 분포 관련 개념 정의 (2)

😀 이번 포스팅의 목표는 

1. 결합·주변·조건부 확률분포 이해
2. 분포 간 관계 학습

 

"2021.12.27 - [생각보다 쉬운 통계학/수리통계학] - [생각보다 쉬운 통계학] 2. 분포 관련 개념 정의 (1)"에서 이어집니다.


1. 결합 확률 분포( Joint distribution )

앞서 살펴본 확률분포의 정의는 1개의 확률변수에 대한 함수를 나타냈습니다.

🙄❓ 그렇다면 2개 이상의 확률변수에 대한 함수는 어떻게 정의를 할까요?

 

  • 결합 확률 밀도 함수(joint probability density function; joint pdf)
    확률변수 $X, Y$가 이산형인 경우) $ f_{X, Y}(x,y) = P(X=x, Y=y) $
    확률변수 $X, Y$가 연속형인 경우 임의의 영역 $A$에 대하여) $ P\left [ \left ( X, Y \right ) \in A \right ]=\iint_{A}^{}f_{X,Y}(x,y)dxdy $
    • 조건
      1.  $f_{X, Y}(x,y) \geq 0$
      2. 확률변수 $X, Y$가 이산형인 경우) $\sum_{x}^{}\sum_{y}^{}f_{X,Y}f(x,y)=1$
        확률변수 $X, Y$가 연속형인 경우) $ \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}f_{X,Y}f(x,y)dxdy =1 $
    • $P(A \cap B) = P(A) \cdot P(B)$을 만족하는 독립 개념은 $ f_{X,Y}(x,y) = f_{X}(x) \cdot f_{Y}(y) $ 으로 표기할 수 있습니다.

2. 주변 확률 밀도 함수( Marginal probability density function )

🙄❓ 친절하지 않은 수학에서 결합 확률 밀도 함수가 주어졌을 때, 각 변수의 분포는 어떻게 구할까요?

 

  • 주변 확률 밀도 함수(marginal probability density function; marginal pdf)
    확률변수 $X, Y$가 이산형인 경우 $X$의 분포 : $f_{X}(x)=\sum_{y}^{}f_{X,Y}(x,y)$
    확률변수 $X, Y$가 이산형인 경우 $Y$의 분포 : $f_{Y}(y)=\sum_{x}^{}f_{X,Y}(x,y)$

    확률변수 $X, Y$가 연속형인 경우 $X$의 분포 : $f_{X}(x)=\int_{-\infty}^{\infty}f_{X,Y}(x,y)dy$
    확률변수 $X, Y$가 연속형인 경우 $Y$의 분포 : $f_{Y}(y)=\int_{-\infty}^{\infty}f_{X,Y}(x,y)dx$

3. 조건부 확률 밀도 함수( Conditional probability density function )

지난 포스팅에서 조건부 확률에 대해서 알려드린 적 있습니다. 

기억나지 않으시다면, 아래 참고해주세요.

2021.12.20 - [생각보다 쉬운 통계학/수리통계학] - [생각보다 쉬운 통계학] 1. 기본 개념 정의 (2)

조건부 확률 개념을 활용한 조건부 확률 밀도 함수를 정의할 수 있습니다.

 

  • 조건부 확률 밀도 함수(conditional probability density function; conditional pdf)
    $ X=x $가 주어졌을 때, 확률변수 $Y$를 $Y | X=x$라고 할 때,
    $ f_{X}(x) > 0 $의 조건 하에서, $f_{Y|X}(y|x) = \dfrac{f_{X,Y}(x,y)}{f_{X}(x)} $

    • 평균(기댓값), 분산, 표준편차
      • 확률변수 $X, Y$가 이산형인 경우 평균(기댓값) : $ E(Y|X)=\sum_{y}^{}y f_{Y|x}(y|x) $
        확률변수 $X, Y$가 연속인 경우 평균(기댓값) : $ E(Y|X)=\int_{-\infty}^{\infty}y f_{Y|x}(y|x) $

      • 확률변수 $X, Y$가 이산/연속형인 경우 분산 : $ Var(Y|x) = E\left [ \left ( Y-E(Y|x)  \right )^2 |x\right ]$
      • 표준편차 : $ \sigma = \sqrt{Var(X)}  $
    • 독립
      • 독립 관계인 확률변수 $X, Y$에 대하여 $ E(Y|x) = E(Y) $, $ E(X|y) = E(X) $

'분포'를 학습하기 위한 바탕이 되는 개념, 이해되셨나요?

앞으로 살펴볼 분포 간 관계는 아래와 같습니다.

 

다음 포스팅부터는 분포에 대해서 진행하고자 합니다😊

 

참고자료 )

 - 송성주, 전명식. (2021). 수리통계학. 자유아카데미

 - 김우철. (2021). 개정판 수리통계학. 민영사

TAGS.

Comments