목차
개요
본 포스팅은 하단의 글을 통해 개념을 숙지하고 와야지 쉽게 이해가 가능하다.
이번 포스트에서는 확률 변수의 이산형(discrete)과 연속형(continuous)의 합산 방식의 차이와 각각에 대한 평균과 분산에 대해 알아보고 특징에 대해서도 알아본다.
discrete ; 이산형 확률변수의 평균과 분산
평균값
이산형 확률 변수 X의 평균값은 각각의 값 x가 발생할 확률 p(x)와 그 값 x의 가중치를 곱한 것을 모두 더한 것이다.
이는 연속적이지 않고 '이산'적으로 분포하고 있기 때문이다.
μ = E(X) = Σxp(x)
여기서 E(X)는 X의 기댓값(expected value)을 의미한다.
분산
이산형 확률 변수 X의 분산은 각각의 값 x에서 평균값 μ를 뺀 차이를 제곱한 것에 그 값이 나올 확률 p(x)를 곱하여 모두 더한 것이다.
여기까지는 고등학교 내용이어서 쉽게 이해가 갈것이다.
σ^2 = V(X) = Σ[x - μ]^2p(x)
여기서 V(X)는 X의 분산(variance)을 의미한다.
continuous; 연속형 확률변수의 평균과 분산
평균값
연속형 확률 변수 X의 평균값은 확률 밀도 함수 f(x)와 그 값 x의 가중치를 곱한 것을 모두 적분한 것이다.
적분 개념을 가지고 있다면 이산형을 이해할때의 흐름 그대로 가져가도 좋다.
μ = E(X) = ∫xf(x)dx
여기서 E(X)는 X의 기댓값(expected value)을 의미합니다.
분산
연속형 확률 변수 X의 분산은 각각의 값 x에서 평균값 μ를 뺀 차이를 제곱한 것에 그 값이 나올 확률 밀도 함수 f(x)를 곱하여 모두 적분한 것이다.
σ^2 = V(X) = ∫[x - μ]^2f(x)dx
여기서 V(X)는 X의 분산(variance)을 의미한다.
확률변수의 확률 합산 방법의 차이
이산형 확률 변수
각각의 값에 대한 확률을 더하여 전체 확률을 구한다.
예를 들어, 동전 던지기에서 앞면이 나올 확률과 뒷면이 나올 확률을 더하여 전체 확률인 1이 된다.
연속형 확률 변수
밀도 함수(density function)를 이용하여 전체 구간에서의 면적을 구한다. 밀도 함수는 특정 구간에서의 확률 밀도를 나타내며, 이를 적분하여 전체 구간에서의 면적을 계산한다.
예를 들어, 정규 분포에서 평균과 표준편차를 이용하여 밀도 함수를 계산하고, 이를 적분하여 전체 구간에서의 면적을 계산한다.
확률 변수의 특징
확률 변수의 평균값과 분산에 대한 특징을 알아보자면
- 평균값은 확률 변수가 가질 수 있는 값들에 대해 가중평균을 구하는 것으로, 이 값은 확률 변수가 어디쯤에 위치하는지를 나타내는 중요한 지표이다.
- 분산은 확률 변수가 평균값으로부터 얼마나 떨어져 있는지를 나타내는 지표로, 값이 작을수록 확률 변수의 값이 평균값 주변에 모여있는 것을 의미한다.
- 확률 변수의 평균값과 분산은 각각 기댓값과 2차 중심적인 지표로 사용된다.
앞으로 포스팅할 선형변환, 모멘트, 분포 특성에 따라서 이산형 확률변수의 특징이 생기는데 추후에 설명하겠다.
-해당포스팅 연결 예정
'Machine Learning' 카테고리의 다른 글
RV / standard random variable[Z-score] 표준 확률 변수 (0) | 2023.04.06 |
---|---|
RV / non-linear & linear TF 확률 변수 비선형 & 선형 변환 (0) | 2023.04.06 |
Concept/ Random Variables 확률변수 (0) | 2023.04.06 |
Concept/ Unconstrained, constrained optimization 비구속/ 구속 제약 최적화 (0) | 2023.04.05 |
Concept/ Decision Variable 결정변수 (0) | 2023.04.04 |