[생각보다 쉬운 통계학] 2. 분포 관련 개념 정의 (2)
😀 이번 포스팅의 목표는
1. 결합·주변·조건부 확률분포 이해
2. 분포 간 관계 학습
"2021.12.27 - [생각보다 쉬운 통계학/수리통계학] - [생각보다 쉬운 통계학] 2. 분포 관련 개념 정의 (1)"에서 이어집니다.
1. 결합 확률 분포( Joint distribution )
앞서 살펴본 확률분포의 정의는 1개의 확률변수에 대한 함수를 나타냈습니다.
🙄❓ 그렇다면 2개 이상의 확률변수에 대한 함수는 어떻게 정의를 할까요?
- 결합 확률 밀도 함수(joint probability density function; joint pdf)
확률변수 $X, Y$가 이산형인 경우) $ f_{X, Y}(x,y) = P(X=x, Y=y) $
확률변수 $X, Y$가 연속형인 경우 임의의 영역 $A$에 대하여) $ P\left [ \left ( X, Y \right ) \in A \right ]=\iint_{A}^{}f_{X,Y}(x,y)dxdy $
- 조건
- $f_{X, Y}(x,y) \geq 0$
- 확률변수 $X, Y$가 이산형인 경우) $\sum_{x}^{}\sum_{y}^{}f_{X,Y}f(x,y)=1$
확률변수 $X, Y$가 연속형인 경우) $ \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}f_{X,Y}f(x,y)dxdy =1 $
- $P(A \cap B) = P(A) \cdot P(B)$을 만족하는 독립 개념은 $ f_{X,Y}(x,y) = f_{X}(x) \cdot f_{Y}(y) $ 으로 표기할 수 있습니다.
- 조건
2. 주변 확률 밀도 함수( Marginal probability density function )
🙄❓ 친절하지 않은 수학에서 결합 확률 밀도 함수가 주어졌을 때, 각 변수의 분포는 어떻게 구할까요?
- 주변 확률 밀도 함수(marginal probability density function; marginal pdf)
확률변수 $X, Y$가 이산형인 경우 $X$의 분포 : $f_{X}(x)=\sum_{y}^{}f_{X,Y}(x,y)$
확률변수 $X, Y$가 이산형인 경우 $Y$의 분포 : $f_{Y}(y)=\sum_{x}^{}f_{X,Y}(x,y)$
확률변수 $X, Y$가 연속형인 경우 $X$의 분포 : $f_{X}(x)=\int_{-\infty}^{\infty}f_{X,Y}(x,y)dy$
확률변수 $X, Y$가 연속형인 경우 $Y$의 분포 : $f_{Y}(y)=\int_{-\infty}^{\infty}f_{X,Y}(x,y)dx$
3. 조건부 확률 밀도 함수( Conditional probability density function )
지난 포스팅에서 조건부 확률에 대해서 알려드린 적 있습니다.
기억나지 않으시다면, 아래 참고해주세요.
2021.12.20 - [생각보다 쉬운 통계학/수리통계학] - [생각보다 쉬운 통계학] 1. 기본 개념 정의 (2)
조건부 확률 개념을 활용한 조건부 확률 밀도 함수를 정의할 수 있습니다.
- 조건부 확률 밀도 함수(conditional probability density function; conditional pdf)
$ X=x $가 주어졌을 때, 확률변수 $Y$를 $Y | X=x$라고 할 때,
$ f_{X}(x) > 0 $의 조건 하에서, $f_{Y|X}(y|x) = \dfrac{f_{X,Y}(x,y)}{f_{X}(x)} $
- 평균(기댓값), 분산, 표준편차
- 확률변수 $X, Y$가 이산형인 경우 평균(기댓값) : $ E(Y|X)=\sum_{y}^{}y f_{Y|x}(y|x) $
확률변수 $X, Y$가 연속형인 경우 평균(기댓값) : $ E(Y|X)=\int_{-\infty}^{\infty}y f_{Y|x}(y|x) $ - 확률변수 $X, Y$가 이산/연속형인 경우 분산 : $ Var(Y|x) = E\left [ \left ( Y-E(Y|x) \right )^2 |x\right ]$
- 표준편차 : $ \sigma = \sqrt{Var(X)} $
- 확률변수 $X, Y$가 이산형인 경우 평균(기댓값) : $ E(Y|X)=\sum_{y}^{}y f_{Y|x}(y|x) $
- 독립
- 독립 관계인 확률변수 $X, Y$에 대하여 $ E(Y|x) = E(Y) $, $ E(X|y) = E(X) $
- 평균(기댓값), 분산, 표준편차
'분포'를 학습하기 위한 바탕이 되는 개념, 이해되셨나요?
앞으로 살펴볼 분포 간 관계는 아래와 같습니다.
다음 포스팅부터는 분포에 대해서 진행하고자 합니다😊
참고자료 )
- 송성주, 전명식. (2021). 수리통계학. 자유아카데미
- 김우철. (2021). 개정판 수리통계학. 민영사
'생각보다 쉬운 통계학 > 수리통계학' 카테고리의 다른 글
[생각보다 쉬운 통계학] 3.분포 - 이산형 분포 (2) (0) | 2022.01.16 |
---|---|
[생각보다 쉬운 통계학] 3. 분포 - 이산형 분포 (1) (0) | 2022.01.10 |
[생각보다 쉬운 통계학] 2. 분포 관련 개념 정의 (1) (0) | 2021.12.27 |
[생각보다 쉬운 통계학] 1. 기본 개념 정의 (2) (0) | 2021.12.20 |
[생각보다 쉬운 통계학] 1. 기본 개념 정의 (1) (0) | 2021.12.18 |
TAGS.