확률 및 통계 기초 이해하기: 기대값과 분산
확률과 통계에서 기대값과 분산은 데이터의 중심 경향과 변동성을 이해하는 데 중요한 개념입니다. 이번 글에서는 확률 변수의 기대값 계산과 분산 및 표준 편차의 계산과 해석에 대해 알아보겠습니다.
1. 기대값 (Expected Value)
기대값은 확률 변수가 취할 수 있는 값들의 가중 평균으로, 확률 분포의 중심을 나타냅니다. 이는 확률 변수의 장기적인 평균 값을 의미합니다.
이산 확률 변수의 기대값
이산 확률 변수 X의 기대값 E(X)는 다음과 같이 계산됩니다.
여기서 xi는 확률 변수 X가 취할 수 있는 값이고, 는 해당 값이 발생할 확률입니다.
예제: 이산 확률 변수의 기대값
공정한 주사위를 한 번 던졌을 때 나올 수 있는 값의 기대값을 구해보겠습니다.
- 가능한 값 : 1, 2, 3, 4, 5, 6
- 각 값의 확률 :
따라서, 주사위를 한 번 던졌을 때 나올 수 있는 값의 기대값은 3.5입니다.
연속 확률 변수의 기대값
연속 확률 변수 X의 기대값 E(X)는 다음과 같이 계산됩니다.
여기서 f(x)는 확률 밀도 함수(PDF)입니다.
예제: 연속 확률 변수의 기대값
0과 10 사이에서 균일하게 분포하는 확률 변수 의 기대값을 구해보겠습니다.
- 확률 밀도 함수:
따라서, 0과 10 사이에서 균일하게 분포하는 확률 변수의 기대값은 5입니다.
2. 분산 (Variance)과 표준 편차 (Standard Deviation)
분산은 확률 변수의 값들이 기대값을 중심으로 얼마나 퍼져 있는지를 나타내는 지표입니다. 표준 편차는 분산의 양의 제곱근으로, 데이터의 변동성을 직관적으로 이해하는 데 사용됩니다.
이산 확률 변수의 분산
이산 확률 변수 X의 분산 Var(X)는 다음과 같이 계산됩니다.
예제: 이산 확률 변수의 분산
공정한 주사위를 한 번 던졌을 때 나올 수 있는 값의 분산을 구해보겠습니다.
- 기대값 E(X) = 3.5
- 가능한 값: 1, 2, 3, 4, 5, 6
- 각 값의 확률:
따라서, 주사위를 한 번 던졌을 때 나올 수 있는 값의 분산은 약 2.92입니다. 표준 편차 σ(sigma)는 분산의 제곱근으로, 약 1.71입니다.
연속 확률 변수의 분산
연속 확률 변수 X의 분산 Var(X)는 다음과 같이 계산됩니다.
예제: 연속 확률 변수의 분산
0과 10 사이에서 균일하게 분포하는 확률 변수 X의 분산을 구해보겠습니다.
- 기대값 E(X) = 5
- 확률 밀도 함수:
따라서, 0과 10 사이에서 균일하게 분포하는 확률 변수의 분산은 약 8.33입니다. 표준 편차 σ(sigma)는 분산의 제곱근으로, 약 2.89입니다.
마무리
기대값과 분산은 확률 및 통계에서 중요한 개념으로, 데이터의 중심 경향과 변동성을 이해하는 데 필수적입니다. 기대값은 확률 변수의 평균 값을 나타내며, 분산은 데이터가 평균으로부터 얼마나 퍼져 있는지를 나타냅니다. 이를 통해 데이터를 더 깊이 이해하고 분석할 수 있습니다. 다음 글에서는 이러한 기본 개념을 바탕으로 더 복잡한 확률 이론과 통계 기법에 대해 알아보겠습니다.
궁금한 점이 있거나 추가 설명이 필요한 부분이 있다면 댓글로 남겨주세요! 함께 학습해 나갑시다.
'인공지능학 > 확률 및 통계' 카테고리의 다른 글
[확률 및 통계] 7. 회귀분석과 상관분석 (0) | 2024.06.29 |
---|---|
[확률 및 통계] 6. 통계적 추론 (0) | 2024.06.29 |
[확률 및 통계] 4. 확률 분포 (0) | 2024.06.15 |
[확률 및 통계] 3. 조건부 확률과 독립성 (0) | 2024.06.15 |
[확률 및 통계] 2. 확률의 정의와 법칙 (0) | 2024.06.15 |