期望值、變異數、偏峰態與動差¶
期望值¶
定義
離散型隨機變數 \(X\) ,其期望值為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率質量函數。
定義
連續型隨機變數 \(X\) ,其期望值為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率密度函數。
期望值目的在於衡量一個機率分配的中心,可以想像在機率分配的中間點畫一條垂直線,就是這個機率分配的期望值。
以數學上的定義來看,就是把隨機變數 \(X\) 所有可能出現的值,與這個值出現的機率相乘以後再加總,這其實就是加權平均的概念。
以我們之前舉到的一些分配為例
import numpy as np
import scipy.stats as stats
from plotly.subplots import make_subplots
import plotly.graph_objects as go
fig = make_subplots(rows=2, cols=2)
# 資料
data = {
    'discrete': {
        'bernoulli': {
            'x': [0, 1],
            'y': [stats.bernoulli.pmf(x, p=0.5) for x in [0, 1]],
            'mean': stats.bernoulli.mean(p=0.5),
            'label': '$X \sim \mathcal{Ber}(p=0.5)$',
        },
        'binomial': {
            'x': [i for i in range(0, 11)],
            'y': [stats.binom.pmf(x, n=10, p=0.5) for x in range(0, 11)],
            'mean': stats.binom.mean(n=10, p=0.5),
            'label': '$X \sim \mathcal{Binom}(n=10, p=0.5)$',
        },
    },
    'continuous': {
        'normal': {
            'x': np.linspace(-5, 5, 100),
            'y': [stats.norm.pdf(x) for x in np.linspace(-5, 5, 100)],
            'mean': stats.norm.mean(),
            'label': '$X \sim \mathcal{N}(\mu=0, \sigma^2=1)$',
        },
        'uniform': {
            'x': np.linspace(-1, 2, 100),
            'y': [stats.uniform.pdf(x) for x in np.linspace(-1, 2, 100)],
            'mean': stats.uniform.mean(),
            'label': '$X \sim \mathcal{U}(0, 1)$',
        },
    },
}
# 離散型
for i, col in enumerate(['bernoulli', 'binomial'], start=1):
    fig.add_trace(
        go.Bar(
            x=data['discrete'][col]['x'],
            y=data['discrete'][col]['y'],
            name=data['discrete'][col]['label'],
        ),
        row=1,
        col=i,
    )
    fig.add_vline(
        x=data['discrete'][col]['mean'],
        row=1,
        col=i,
        line_color='red',
    )
# 連續型
for i, col in enumerate(['normal', 'uniform'], start=1):
    fig.add_trace(
        go.Scatter(
            x=data['continuous'][col]['x'],
            y=data['continuous'][col]['y'],
            name=data['continuous'][col]['label'],
        ),
        row=2,
        col=i,
    )
    fig.add_vline(
        x=data['continuous'][col]['mean'],
        row=2,
        col=i,
        line_color='red',
    )
fig.update_layout(title={'text': '常見分配的期望值'})
fig
變異數¶
定義
離散型隨機變數 \(X\) ,其變異數為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率質量函數。
定義
連續型隨機變數 \(X\) ,其變異數為
其中 \(R_X\) 為隨機變數 \(X\) 的值域,而 \(f_X(x)\) 為 \(X\) 的機率密度函數。
偏態¶
定義
離散型隨機變數 \(X\) 的峰態,其定義為
定義
連續型隨機變數 \(X\) 的峰態,其定義為
峰態¶
定義
離散型隨機變數 \(X\) 的峰態,其定義為
定義
連續型隨機變數 \(X\) 的峰態,其定義為
動差¶
定義
連續型隨機變數 \(X\) 的 \(n\) 階動差,其定義為
其中 \(R_X\) 為 \(X\) 的值域, \(f_X(x)\) 為 \(X\) 的機率密度函數。
主動差¶
主動差就是動差函數的 \(c\) 以隨機變數 \(X\) 的期望值 \(\mathbb{E}(X)\) 取代。
定義
連續型隨機變數 \(X\) 的 \(k\) 階主動差,其定義為
其中 \(R_X\) 為 \(X\) 的值域, \(f_X(x)\) 為 \(X\) 的機率密度函數。
- \(k = 0\) 時, \(\mu_0 = 1\) 
- \(k = 1\) 時, \(\mu_1 = 0\) 
- \(k = 2\) 時, \(\mu_2 = Var(X)\) 
- \(k = 3\) 時, \(\mu_3\) 可用於定義偏度 
- \(k = 4\) 時, \(\mu_4\) 可用於定義峰度 
