一日坊主

雰囲気でやっている

PRML上巻 P17

1.2.1 確率密度

連続変数についての確率を考える. 実数値を取る変数x区間(x,x+\delta x)に入る確率が,\delta x \to 0のときp(x)\delta xで与えられるとき,p(x)x上の確率密度(probability density)とよぶ.

このとき,x区間(a,b)にある確率は

\displaystyle{
p(x\in(a,b))=\int_{a}^{b}p(x)\mathrm{d}x \tag{1.24}
}

で与えられる.

確率は非負でxは実数上のどこかの値をとらなければならないことから,確率密度は以下の2つの条件を満たす.


\begin{align*}
p(x)\geq 0 \tag{1.25} \\
\int_{-\infty}^{\infty}p(x)\mathrm{d}x=1 \tag{1.26} \\
\end{align*}

ここで,変数変換x=g(y)を考える. 確率密度p_x(x)に対応する,新しい変数yに関する密度p_y(y)を考えると, 区間(x,x+\delta x)に入る観測値は,\delta xが小さければ区間(y, y+\delta y)に入り, p_x(x)\delta x \simeq p_y(y)\delta yとなる.したがって,


\begin{align*}
p_y(y)&=p_x(x)\left|\frac{\mathrm{d}x}{\mathrm{d}y}\right| \\
&=p_x(g(y))\left|g'(y)\right| \tag{1.27} \\
\end{align*}

となる.

この性質から分かることは,確率密度の最大値は変数の選び方に依存するということ.

今日はここまで.