期望值、變異數、偏峰態與動差¶
期望值¶
定義
離散型隨機變數 \(X\) ,其期望值為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率質量函數。
定義
連續型隨機變數 \(X\) ,其期望值為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率密度函數。
期望值目的在於衡量一個機率分配的中心,可以想像在機率分配的中間點畫一條垂直線,就是這個機率分配的期望值。
以數學上的定義來看,就是把隨機變數 \(X\) 所有可能出現的值,與這個值出現的機率相乘以後再加總
,這其實就是加權平均的概念。
以我們之前舉到的一些分配為例
import numpy as np
import scipy.stats as stats
from plotly.subplots import make_subplots
import plotly.graph_objects as go
fig = make_subplots(rows=2, cols=2)
# 資料
data = {
'discrete': {
'bernoulli': {
'x': [0, 1],
'y': [stats.bernoulli.pmf(x, p=0.5) for x in [0, 1]],
'mean': stats.bernoulli.mean(p=0.5),
'label': '$X \sim \mathcal{Ber}(p=0.5)$',
},
'binomial': {
'x': [i for i in range(0, 11)],
'y': [stats.binom.pmf(x, n=10, p=0.5) for x in range(0, 11)],
'mean': stats.binom.mean(n=10, p=0.5),
'label': '$X \sim \mathcal{Binom}(n=10, p=0.5)$',
},
},
'continuous': {
'normal': {
'x': np.linspace(-5, 5, 100),
'y': [stats.norm.pdf(x) for x in np.linspace(-5, 5, 100)],
'mean': stats.norm.mean(),
'label': '$X \sim \mathcal{N}(\mu=0, \sigma^2=1)$',
},
'uniform': {
'x': np.linspace(-1, 2, 100),
'y': [stats.uniform.pdf(x) for x in np.linspace(-1, 2, 100)],
'mean': stats.uniform.mean(),
'label': '$X \sim \mathcal{U}(0, 1)$',
},
},
}
# 離散型
for i, col in enumerate(['bernoulli', 'binomial'], start=1):
fig.add_trace(
go.Bar(
x=data['discrete'][col]['x'],
y=data['discrete'][col]['y'],
name=data['discrete'][col]['label'],
),
row=1,
col=i,
)
fig.add_vline(
x=data['discrete'][col]['mean'],
row=1,
col=i,
line_color='red',
)
# 連續型
for i, col in enumerate(['normal', 'uniform'], start=1):
fig.add_trace(
go.Scatter(
x=data['continuous'][col]['x'],
y=data['continuous'][col]['y'],
name=data['continuous'][col]['label'],
),
row=2,
col=i,
)
fig.add_vline(
x=data['continuous'][col]['mean'],
row=2,
col=i,
line_color='red',
)
fig.update_layout(title={'text': '常見分配的期望值'})
fig
變異數¶
定義
離散型隨機變數 \(X\) ,其變異數為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率質量函數。
定義
連續型隨機變數 \(X\) ,其變異數為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率密度函數。
偏態¶
定義
離散型隨機變數 \(X\) 的峰態,其定義為
定義
連續型隨機變數 \(X\) 的峰態,其定義為
峰態¶
定義
離散型隨機變數 \(X\) 的峰態,其定義為
定義
連續型隨機變數 \(X\) 的峰態,其定義為
動差¶
定義
連續型隨機變數 \(X\) 的 \(n\) 階動差,其定義為
其中 \(R_X\) 為 \(X\) 的值域, \(f_X(x)\) 為 \(X\) 的機率密度函數。
主動差¶
主動差就是動差函數的 \(c\) 以隨機變數 \(X\) 的期望值 \(\mathbb{E}(X)\) 取代。
定義
連續型隨機變數 \(X\) 的 \(k\) 階主動差,其定義為
其中 \(R_X\) 為 \(X\) 的值域, \(f_X(x)\) 為 \(X\) 的機率密度函數。
\(k = 0\) 時, \(\mu_0 = 1\)
\(k = 1\) 時, \(\mu_1 = 0\)
\(k = 2\) 時, \(\mu_2 = Var(X)\)
\(k = 3\) 時, \(\mu_3\) 可用於定義偏度
\(k = 4\) 時, \(\mu_4\) 可用於定義峰度