PRML上巻 P1-5 - 一日坊主

とりあえず， PRML を頭から読み直すやつをやることにした．

今日は「1.1 多項式曲線フィッティング」をやってみる．

訓練集合として， $N$ 個の観測値 $x$ を並べた $\mathbf{x}\equiv(x_1,\ldots,x_N)^ \mathrm{T}$ と，それぞれに対応する観測値 $t$ を並べた $\mathbf{t}\equiv(t_1,\ldots,t_N)^ \mathrm{T}$ が与えられる．

我々の目標は，この訓練集合を利用して，新たな入力変数の値 $\hat{x}$ に対して目標変数 $\hat{t}$ の値を予測することである．

まず，関数 $sin(2 \pi x)$ にガウシアンノイズを加えて， $N = 10$ 個の訓練データを生成する．

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(42)

# t = sin(2 \pi x)
x1 = np.linspace(0, 1, 100)
t1 = np.sin(2 * np.pi * x1)
plt.plot(x1, t1, color='green')

# training data set
# t = sin(2 \pi x) + gaussian noise
x2 = np.linspace(0, 1, 10)
t2 = np.sin(2 * np.pi * x2) + np.random.normal(0, 0.2, 10)
plt.scatter(x2, t2, facecolor='None', edgecolor='blue')

plt.xlabel('x')
plt.ylabel('t')