アクチュアリー試験受験の知恵(4)

今回は「数値を簡略化する」というテーマで考えてみます。
この方法は、選択式ということに関係なく使える手法です。

例によって過去問からです。

「次のデータはある試験片の硬度xと引張り強さyの測定値である。
このデータを回帰分析により解析して、yxに対する回帰式を求めると y=\fbox{1}x+\fbox{2}である。

硬   度 55 55 55 65 65 70 70 80 80 85 85 85
引張り強さ 29 32 31 31 34 36 35 36 33 37 35 36

データの個数をn=12
求める回帰式をy=\hat{\alpha}+\hat{\beta}xとおき、
硬度と引っ張り強さの各数値を(x_i,y_i) \, (1 \le i  \le 12)とすると、

\left( \begin{array}{cc} n & \sum_{i=1}^n x_{i} \\ \\ \\ \\ \sum_{i=1}^n x_{i} & \sum_{i=1}^n x_{i}^2 \\ \end{array} \right) \left( \begin{array}{c} \hat{\alpha} \\ \\ \\ \\ \\ \\ \\ \\ \\ \\ \\ \\ \hat{\beta} \\ \end{array} \right) = \left( \begin{array}{c} \sum_{i=1}^n y_{i} \\ \\ \\ \\ \sum_{i=1}^n x_{i}y_{i} \\ \end{array} \right) \cdots (*)

を解けばよいことになります。

ところが、与えられた数値のままで求めに行こうとすると、存外計算が面倒になり間違いのリスクが高くなります。
実際、この問題をアクチュアリー試験受験者に出題したところ途中で計算間違いをしたりして中々正解にはたどりつけませんでした。

(1)xは5の倍数で70前後
(2)yは30〜36くらいが多い
ということに着目して、
(例えば)
x'=\frac{x-70}{5}\; , \; y'=y-34 \cdots (a)
とおいて、x'y'の回帰式
y'=\hat{\alpha '}+\hat{\beta '}x' \cdots (b)を求めることを考えます。

このとき、(a)を(b)に代入すると、
y'=\hat{\alpha '}-14\hat{\beta '}+34+\frac{\hat{\beta '}}{5}x'
になるので、
\hat{\alpha}=\hat{\alpha '}-14\hat{\beta '}+34 , \hat{\beta}=\frac{\hat{\beta '}}{5}
となります。

x'y'の表は、

x' -3 -3 -3 -1 -1 0 0 2 2 3 3 3
y' -5 -2 -3 -3 0 2 1 2 -1 3 1 2

であり、
\left( \begin{array}{cc} n & \sum_{i=1}^n x'_{i} \\ \\ \\ \\ \sum_{i=1}^n x'_{i} & \sum_{i=1}^n x'_{i}^2 \\ \end{array} \right) \left( \begin{array}{c} \hat{\alpha '} \\ \\ \\ \\ \\ \\ \\ \\ \\ \\ \\ \\ \hat{\beta '} \\ \end{array} \right) = \left( \begin{array}{c} \sum_{i=1}^n y'_{i} \\ \\ \\ \\ \sum_{i=1}^n x'_{i}y'_{i} \\ \end{array} \right)
となるので、
\left( \begin{array}{cc} 12 & 2 \\ \\ \\ \\ 2 & 64 \\ \end{array} \right) \left( \begin{array}{c} \hat{\alpha '} \\ \hat{\beta '} \\ \end{array} \right) = \left( \begin{array}{c} -3 \\ \\ \\ \\ 53 \\ \end{array} \right) \cdots (**)
となります。
これを解くと、
\hat{\alpha '} =\frac{-149}{382} \; , \; \hat{\beta '} =\frac{321}{382}
であり、
\hat{\alpha}=\hat{\alpha '}-14\hat{\beta '}+34=\frac{8345}{382} \; , \; \hat{\beta}=\frac{\hat{\beta '}}{5}=\frac{321}{1910}
で最終的な式は、
y=\frac{8345}{382}+\frac{321}{1910}x
となります。

(なお、過去問題集の解答ではx'=\frac{x-70}{5}\; , \; y'=y-33で考えていました)

(*)を解くことは難しくても、(**)であれば(場合によっては)筆算でも解くことは可能です。

ご存知のように平成17年度試験からモデリングが試験範囲に入ったため、回帰分析は頻出分野になっています。

したがってこのような数値の簡略化の手法は重要になってくると考えられますが、そのような簡略化を凌ぐ出題とそれへの対処法について次回考えてみたいと思います。