ヘロログ
統計学

連続一様分布

連続一様分布は、もっとも基本的な連続型確率分布の一つである。「ある区間内のどの値も同じ確率密度で出現する」という単純な状況をモデル化する。離散値に対して同様の性質をもつのが離散一様分布である。

日常生活にも連続一様分布で近似できる現象は多い。ある時刻にバス停に到着したとき、次のバスが来るまでの待ち時間(バスが等間隔で運行している場合)、ルーレットの針が止まる角度、工場の製品検査で許容誤差範囲内に収まる場合の誤差の分布などが挙げられる。

統計学やシミュレーションにおいて、連続一様分布は乱数生成の基礎として極めて重要である。コンピュータで生成される疑似乱数は通常、区間 [0, 1] 上の一様分布に従い、これを変換して正規分布指数分布など他の分布に従う乱数を生成する。

定義

a < b を満たす実数 a, b に対して、確率変数 X が区間 [a, b] 上で一定の確率密度をもつとき、X連続一様分布(continuous uniform distribution)に従うという。この分布を U(a, b) と表記する。

連続一様分布の確率密度関数
f(x) = \begin{cases} \dfrac{1}{b - a} & (a \leq x \leq b) \\[8pt] 0 & (\text{その他}) \end{cases}

区間 [a, b] の外では確率密度が0であり、区間内では \dfrac{1}{b-a} で一定である。確率密度関数の積分は1になるという条件から、この値が導かれる。

\int_{-\infty}^{\infty} f(x) \, dx = \int_{a}^{b} \dfrac{1}{b-a} \, dx = \dfrac{1}{b-a} \cdot (b - a) = 1

確率密度関数のグラフ

連続一様分布の確率密度関数は、区間 [a, b] 上で水平な直線となる。以下は U(2, 8)a=2, b=8)の場合である。

f(x) 1/6 0 x 0 2 5 8 10 a b
図1: 連続一様分布 U(2, 8) の確率密度関数

グラフの塗りつぶし部分の面積が1に等しい。連続型確率分布では、特定の区間の確率はその区間における確率密度関数の積分(面積)で表される。

累積分布関数

累積分布関数(cumulative distribution function, CDF)F(x) = P(X \leq x) は、確率密度関数を -\infty から x まで積分して得られる。

累積分布関数
F(x) = \begin{cases} 0 & (x < a) \\[8pt] \dfrac{x - a}{b - a} & (a \leq x \leq b) \\[8pt] 1 & (x > b) \end{cases}

区間 [a, b] 内では、F(x)x に対して線形に増加する。

F(x) 1 0 x 0 2 5 8 10 a b
図2: 連続一様分布 U(2, 8) の累積分布関数

確率の計算には累積分布関数を使うと便利である。P(c \leq X \leq d) は次のように計算できる。

P(c \leq X \leq d) = F(d) - F(c) = \dfrac{d - c}{b - a}

この式は、区間の長さ d - c が全体の長さ b - a に占める割合が確率に等しいことを示している。

期待値と分散

期待値

連続一様分布 U(a, b) の期待値は、区間の中点に等しい。

期待値
E[X] = \dfrac{a + b}{2}

【導出】 期待値の定義に従って計算する。

\begin{aligned} E[X] &= \int_{-\infty}^{\infty} x \cdot f(x) \, dx = \int_{a}^{b} x \cdot \dfrac{1}{b-a} \, dx \\[5pt] &= \dfrac{1}{b-a} \left[ \dfrac{x^2}{2} \right]_{a}^{b} = \dfrac{1}{b-a} \cdot \dfrac{b^2 - a^2}{2} \\[5pt] &= \dfrac{(b+a)(b-a)}{2(b-a)} = \dfrac{a + b}{2} \end{aligned}

分散

分散は次の公式で与えられる。

分散
V[X] = \dfrac{(b - a)^2}{12}

【導出】 分散の公式 V[X] = E[X^2] - (E[X])^2 を使う。まず E[X^2] を求める。

\begin{aligned} E[X^2] &= \int_{a}^{b} x^2 \cdot \dfrac{1}{b-a} \, dx = \dfrac{1}{b-a} \left[ \dfrac{x^3}{3} \right]_{a}^{b} \\[5pt] &= \dfrac{b^3 - a^3}{3(b-a)} = \dfrac{(b-a)(b^2 + ab + a^2)}{3(b-a)} = \dfrac{a^2 + ab + b^2}{3} \end{aligned}

したがって、分散は

\begin{aligned} V[X] &= E[X^2] - (E[X])^2 = \dfrac{a^2 + ab + b^2}{3} - \left( \dfrac{a+b}{2} \right)^2 \\[5pt] &= \dfrac{a^2 + ab + b^2}{3} - \dfrac{a^2 + 2ab + b^2}{4} \\[5pt] &= \dfrac{4(a^2 + ab + b^2) - 3(a^2 + 2ab + b^2)}{12} \\[5pt] &= \dfrac{a^2 - 2ab + b^2}{12} = \dfrac{(b - a)^2}{12} \end{aligned}
ポイント

連続一様分布 U(a, b) では

  • 期待値:E[X] = \dfrac{a+b}{2}(区間の中点)
  • 分散:V[X] = \dfrac{(b-a)^2}{12}

モーメント母関数

モーメント母関数(moment generating function)は次のように求められる。

\begin{aligned} M(t) &= E[e^{tX}] = \int_{a}^{b} e^{tx} \cdot \dfrac{1}{b-a} \, dx \\[5pt] &= \dfrac{1}{b-a} \left[ \dfrac{e^{tx}}{t} \right]_{a}^{b} = \dfrac{e^{tb} - e^{ta}}{t(b-a)} \quad (t \neq 0) \end{aligned}

t = 0 のときは M(0) = 1 である。

モーメント母関数を微分して t = 0 を代入することで期待値や高次モーメントを求めることもできる。M'(0) = E[X]M''(0) = E[X^2] の関係がある。

標準一様分布

a = 0, b = 1 の場合、すなわち U(0, 1)標準一様分布という。乱数生成において最も基本的な分布であり、ほとんどのプログラミング言語で提供される乱数関数はこの分布に従う。

標準一様分布の性質:

  • 確率密度関数:f(x) = 1 (0 \leq x \leq 1
  • 累積分布関数:F(x) = x (0 \leq x \leq 1
  • 期待値:E[X] = \dfrac{1}{2}
  • 分散:V[X] = \dfrac{1}{12} \approx 0.0833

線形変換により、標準一様分布から任意の連続一様分布を生成できる。U \sim U(0, 1) のとき、X = a + (b - a)UU(a, b) に従う。

簡単な計算例

例1:バスの待ち時間

あるバス停では、バスが10分間隔で運行している。ランダムな時刻にバス停に到着したとき、待ち時間 X(分)は U(0, 10) に従うとみなせる。

期待値(平均待ち時間)は

E[X] = \dfrac{0 + 10}{2} = 5 \text{ 分}

分散は

V[X] = \dfrac{(10 - 0)^2}{12} = \dfrac{100}{12} = \dfrac{25}{3} \approx 8.33

標準偏差は \sigma = \sqrt{8.33} \approx 2.89 分である。

「待ち時間が3分以下である確率」は

P(X \leq 3) = F(3) = \dfrac{3 - 0}{10 - 0} = 0.3

例2:U(2, 8) の計算

確率変数 XU(2, 8) に従うとする。

期待値と分散を求める。

\begin{aligned} E[X] &= \dfrac{2 + 8}{2} = 5 \\[5pt] V[X] &= \dfrac{(8 - 2)^2}{12} = \dfrac{36}{12} = 3 \end{aligned}

X が3以上6以下となる確率」は

P(3 \leq X \leq 6) = \dfrac{6 - 3}{8 - 2} = \dfrac{3}{6} = 0.5

練習問題

問1. 確率変数 XU(1, 5) に従うとき、期待値、分散を求めよ。また、P(X \leq 2) を求めよ。

期待値と分散は

\begin{aligned} E[X] &= \dfrac{1 + 5}{2} = 3 \\[5pt] V[X] &= \dfrac{(5 - 1)^2}{12} = \dfrac{16}{12} = \dfrac{4}{3} \approx 1.333 \end{aligned}

確率は累積分布関数より

P(X \leq 2) = F(2) = \dfrac{2 - 1}{5 - 1} = \dfrac{1}{4} = 0.25
問2. U \sim U(0, 1) のとき、Y = 3U + 2 はどのような分布に従うか。期待値と分散も求めよ。

U[0, 1] を動くとき、Y = 3U + 2[2, 5] を動く。

したがって、Y \sim U(2, 5) に従う。

\begin{aligned} E[Y] &= \dfrac{2 + 5}{2} = 3.5 \\[5pt] V[Y] &= \dfrac{(5 - 2)^2}{12} = \dfrac{9}{12} = 0.75 \end{aligned}

または、線形変換の性質 E[aU+b] = aE[U]+bV[aU+b] = a^2 V[U] を使って

\begin{aligned} E[Y] &= 3 \cdot \dfrac{1}{2} + 2 = 3.5 \\[5pt] V[Y] &= 3^2 \cdot \dfrac{1}{12} = \dfrac{9}{12} = 0.75 \end{aligned}
問3. 確率変数 XU(1, 5) に従うとき、P(2 \leq X \leq 4) を求めよ。

累積分布関数を使って

P(2 \leq X \leq 4) = F(4) - F(2) = \dfrac{4 - 1}{5 - 1} - \dfrac{2 - 1}{5 - 1} = \dfrac{3}{4} - \dfrac{1}{4} = \dfrac{2}{4} = 0.5

または、区間の長さの比として \dfrac{4-2}{5-1} = \dfrac{2}{4} = 0.5

まとめ

項目 内容
分布名 連続一様分布(continuous uniform distribution)
表記 U(a, b)
確率密度関数 f(x) = \dfrac{1}{b-a} (a \leq x \leq b
累積分布関数 F(x) = \dfrac{x-a}{b-a} (a \leq x \leq b
期待値 E[X] = \dfrac{a + b}{2}
分散 V[X] = \dfrac{(b-a)^2}{12}
モーメント母関数 M(t) = \dfrac{e^{tb} - e^{ta}}{t(b-a)} (t \neq 0
応用例 乱数生成、待ち時間モデル、測定誤差

Pythonで実装する

Pythonを使って連続一様分布の計算やシミュレーションを行う。

continuous_uniform.py
import numpy as np
from scipy import stats

# パラメータ設定
a, b = 2, 8  # U(2, 8)

# 期待値と分散(理論値)
E_X = (a + b) / 2
V_X = (b - a)**2 / 12

print("=== 連続一様分布 U(2, 8) ===")
print(f"期待値(理論値): E[X] = {E_X}")
print(f"分散(理論値)  : V[X] = {V_X:.4f}")
print(f"標準偏差       : σ = {np.sqrt(V_X):.4f}")

# scipy.statsを使用した計算
# uniform(loc, scale) で loc から loc+scale までの一様分布
dist = stats.uniform(loc=a, scale=b-a)
print(f"\nscipy.statsによる計算:")
print(f"期待値: {dist.mean()}")
print(f"分散  : {dist.var():.4f}")

# 確率密度関数の確認
print(f"\n確率密度関数 f(x) = 1/(b-a) = 1/{b-a} = {1/(b-a):.4f}")

# 累積分布関数(確率計算)
print(f"\n累積分布関数:")
print(f"  F(3) = P(X ≤ 3) = {dist.cdf(3):.4f}")
print(f"  F(5) = P(X ≤ 5) = {dist.cdf(5):.4f}")
print(f"  F(6) = P(X ≤ 6) = {dist.cdf(6):.4f}")

# 区間の確率
print(f"\n確率計算:")
print(f"  P(3 ≤ X ≤ 6) = {dist.cdf(6) - dist.cdf(3):.4f}")
print(f"  P(X > 5) = {1 - dist.cdf(5):.4f}")

# シミュレーション
np.random.seed(42)
n_samples = 10000
samples = np.random.uniform(a, b, size=n_samples)

print(f"\nシミュレーション(n={n_samples}):")
print(f"標本平均: {np.mean(samples):.4f}")
print(f"標本分散: {np.var(samples, ddof=0):.4f}")
=== 連続一様分布 U(2, 8) === 期待値(理論値): E[X] = 5.0 分散(理論値) : V[X] = 3.0000 標準偏差 : σ = 1.7321 scipy.statsによる計算: 期待値: 5.0 分散 : 3.0000 確率密度関数 f(x) = 1/(b-a) = 1/6 = 0.1667 累積分布関数: F(3) = P(X ≤ 3) = 0.1667 F(5) = P(X ≤ 5) = 0.5000 F(6) = P(X ≤ 6) = 0.6667 確率計算: P(3 ≤ X ≤ 6) = 0.5000 P(X > 5) = 0.5000 シミュレーション(n=10000): 標本平均: 4.9650 標本分散: 2.9780

シミュレーション結果が理論値に近い値を示している。大数の法則により、標本サイズを増やすほど標本平均は期待値に、標本分散は分散に収束する。