アクチュアリー試験受験の知恵(5)

今回は次のような問題を考えてみます。

(p,q,y)なる5個のデータ
(2.3,-3.0,4.2)
(-1.8,-3.4,-0.7)
(-5.1,-1.9,3.8)
(4.6,1.1,5.1)
(3.7,2.5,2.9)
が与えられている。
yp,qで線型回帰(y=\alpha + {\beta}_1 \cdot p+ {\beta}_2 \cdot q)するとき、\alpha ,\beta_1 ,\beta_2の最小二乗法による推定値は、それぞれ、\fbox{1},\fbox{2},\fbox{3}である。
\alpha ,\beta_1 ,\beta_2の全てが求められるまでは小数点以下6桁以上を持って計算するものとし、\alpha ,{\beta}_1 ,{\beta}_2の最終計算結果について、小数点以下第4位を四捨五入して小数点以下第3位まで求めるものとする。)

(A)-0.329
(B)-0.219
(C)-0.107
(D)-0.012
(E) 0.438
(F) 0.478
(G) 0.584
(H) 0.876
(I) 0.913
(J) 0.956

まず、前回
http://d.hatena.ne.jp/actuary_math/20080727
述べた「数値を簡略化する」ということから、全部を10倍(つまり小数点を取っ払った)したデータ
(23,-30,42)
(-18,-34,-7)
(-51,-19,38)
(46,11,51)
(37,25,29)
で考えます。

このデータを
(p',q',y')=(10p,10q,10y)で表すことにし、
回帰式が
y'=\alpha '+ {\beta}_1 '\cdot p'+ {\beta}_2 '\cdot q'
であるとすると、
y=\frac{\alpha '}{10}+ {\beta}_1 '\cdot p+ 10{\beta}_2'\cdot q
となるので、
\alpha =\frac{\alpha '}{10} , {\beta}_1={\beta}_1'  , {\beta}_2={\beta}_2'
であることが分かります。

さて、(\alpha ',{\beta}_1',{\beta}_2')の推定値を
(\hat{\alpha '},\hat{{\beta}_1'},\hat{{\beta}_2'})とするとき、
\left( \begin{array}{ccc} 5 & 37 & 21 \\ 37 & 6939 & 1098 \\  21 & 1098 & 3163 \\ \end{array} \right)\left( \begin{array}{c} \hat{\alpha '} \\ \hat{{\beta}_1'} \\ \hat{{\beta}_2'} \\ \end{array} \right)=\left( \begin{array}{c} 77 \\ 6449 \\ 510 \\ \end{array} \right) \cdots (1)
となるので、この方程式を解いて
(\hat{\alpha '},\hat{{\beta}_1'},\hat{{\beta}_2'})
を求めることになります。

ただし、「この方程式を解」くことが容易ではありません。
(本当はここにいたるまでつまり上記の行列の各成分を出すのも相当面倒なのですがそれはとりあえず置いておくことにします。)

\left( \begin{array}{ccc} 5 & 37 & 21 \\ 37 & 6939 & 1098 \\ 21 & 1098 & 3163 \\ \end{array} \right)
逆行列を求めそれを
\left( \begin{array}{c} 77 \\ 6449 \\ 510 \\ \end{array} \right)
に乗じればいいのですが、

逆行列は、
\frac{1}{98028311}\left( \begin{array}{ccc} 20742453 & -93973 & -109593 \\ -93973 & 15374 & -4713 \\ -105093 & -4713 & 33326 \\ \end{array} \right)
というものです。
a*d-b*cという小行列式の計算(掛算とメモリ演算)を6セット(対称行列なので下半分は計算不要)繰り返して余因子行列を出したあと、行列式を計算(これも掛算とメモリ演算を1セット)を計算しやっと逆行列が算出されます。

こうして得られる逆行列
\left( \begin{array}{c} 77 \\ 6449 \\ 510 \\ \end{array} \right)
に乗じる際にさらに掛算とメモリ演算→割算を3セット(各変数を求めるために)繰り返すことになります。

つまりメモリ演算を都合10セット行うことになります。
通常の電卓ではメモリは1個しかないので都度メモリをクリアしなければいけません。
かつ9桁(行列式=98028311を計算する際に途中桁数が9桁になる)の数を扱うことになります。)

ですからこの問題は
「十分な余裕のない限り(他の問題が全て決着して20分くらい時間がない限り)手を出すべきではない」
問題なのです。
アクチュアリー試験の試験時間等と受験・勉強戦略との関係についてはまた機会を改めて考察いたします。)

さて、できるだけ短時間で答えに「近づく」方法はあるのでしょうか?

ここでは、まず、
(a)ypで線型回帰
(b)yqで線型回帰
を考えてみることにします。

即ち、
y'=\alpha ''+ {\beta}_1 ''\cdot p'
y'=\alpha '''+ {\beta}_2 '''\cdot q'
を考えるわけです。

当然ここで得られる答えは実際の答えとは異なりますが、
「答えのおよその方向性をつかむ」
選択肢問題ならではの手法といえます。

求める式は、
\left( \begin{array}{cc} 5 & 37 \\ 37 & 6939 \\ \end{array} \right)\left( \begin{array}{c} \hat{\alpha ''} \\ \hat{{\beta}_1''} \\ \end{array} \right)=\left( \begin{array}{c} 77 \\ 6449 \\ \end{array} \right) \cdots (2)
及び
\left( \begin{array}{cc} 5 & 21 \\ 21 & 3163 \\ \end{array} \right)\left( \begin{array}{c} \hat{\alpha '''} \\ \hat{{\beta}_2'''} \\ \end{array} \right)=\left( \begin{array}{c} 77 \\ 510 \\ \end{array} \right) \cdots (3)
であり、

2行2列の逆行列を求めるためには、掛算とメモリ演算を1セット(行列式を求める)ですみます。
これに答えを得るための掛算とメモリ演算のセットが各変数に対して1セットずつで合計3セット。
(2)と(3)の2つの式を解くので合計6セットで答えがでます。
前よりも幾分簡単になっています。しかも巨大な数が出てきません。

これを求めると
(\hat{\alpha ''}, \hat{{\beta}_1 ''})=(8.872 \cdots ,0.882  \cdots )
及び
(\hat{\alpha '''}, \hat{{\beta}_2 '''})=(15.145 \cdots ,0.060  \cdots )
となります。

これと選択肢を見比べ((\hat{\alpha ''}, \hat{\alpha '''})については10倍されていることに注意)
\hat{\alpha}の候補としては、(I)か(J)
\hat{{\beta}_1 }の候補としては、(H)か(I)
あたりだと考えられます。
この組み合わせは2×2=4通りですが、\hat{\alpha}\hat{{\beta}_1 }も(I)と同じ値になるとは考えにくいので、
(\hat{\alpha},\hat{{\beta}_1 })の候補を、
ア.(I)-(H)
イ.(J)-(H)
ウ.(J)-(I)
の3通りに絞って考えます。

それぞれについて、
(\hat{\alpha '}, \hat{{\beta}_1' })は、
ア.(9.13,0.876)
イ.(9.56,0.876)
ウ.(9.56,0.913)
となります。(上記と同様\hat{\alpha '}については10倍されています)

ア.〜ウ.のそれぞれで(1)の1行目の式つまり、
5\hat{\alpha '}+37\hat{{\beta}_1' }+21\hat{{\beta}_2'}=77
つまり、
\hat{{\beta}_2' }=\frac{77-5\hat{\alpha '}-37\hat{{\beta}_1'}}{21}
を満たす
\hat{{\beta}_2' }
を求めると、
ア.-0.050・・・
イ.-0.152・・・
ウ.-0.218・・・
となるので、選択肢と見比べて候補として考えられるのは、ウ.になることが分かります。(もとの選択肢(B)に近い)

実際、
(\hat{\alpha '}, \hat{{\beta}_1' },\hat{{\beta}_2' })=(9.56,0.913,-0.219)
で(1)の残りの2行の式もほぼ満たされることが分かります。

したがって答えの可能性として考えられるのは、
(J)-(I)-(B)
の順であり、実際にそれが正解になっています。