アクチュアリー試験「損保数理」改訂箇所への対応(続)


http://d.hatena.ne.jp/actuary_math/20091125
で保留にしていたままになっていた
「係数が0でないことに対するt検定」
について考えてみたいと思います。


そこでも述べましたが、
BHF(ボーンヒュッター・ファーガソン)法とこの回帰分析の係数のt検定が今回の新規追加箇所の中で最重要(試験でも実務でも)
と考えています。


MAHさんのブログ
http://pre-actuaries.com/modules/d3blog/details.php?bid=36&cid=2
では
「なぜか損保数理の試験範囲にモデリング教科書の回帰分析が、入っています。これも不思議ですね。堂々と試験範囲が重複するというのも、如何なものかと思いますが」*1
と述べられていますが、
今までの当該分野(回帰分析)での数学の試験問題に対して、損保数理の試験委員として思うところがあったためではないか
と推察されます。


実務で回帰分析を扱われている方にはご存知だと思いますが、回帰分析を行った場合は、
決定係数(相関係数)をみて、回帰係数が0でないことのt検定を行う
のが通例となっています。
これを欠くと、0と少しでも離れている回帰係数が出たら、それを使って話をあらぬ方向に進めてしまうことになりかねません。*2
昨年のモデリングの試験では誤差分散の推定量が出題されていましたが、それはt検定への一里塚であっても実際の検定とはまだ隔たりがあります。

この点では、公認会計士試験の統計学
(例えば、
http://stepup.yahoo.co.jp/school/shikaku/sokuhou/detail.html?skn=20080822
の第7問の問題1の2など)
のほうが「実務的」であるとさえ言えなくもありません。


前置きはこのくらいにして、「例題で学ぶ損害保険数理」(ISBN:4320017358)の例題84のクレーム単価のほうでt検定行ってみましょう。
問題では、

年:x クレーム単価(実績値):y
1 2,280
2 2,530
3 2,460
4 2,600
5 2,580

というデータがあって、回帰分析した結果を
y=cx+d=67x+2,289
として出し、この結果の予測値を

年:x クレーム単価(予測値):cx+d
1 2,356
2 2,423
3 2,490
4 2,557
5 2,624

としています。
ここで、
誤差分散の推定量は、
\hat{\sigma}^2=\frac{1}{n-2}\sum_{i=1}^n e_i^2
=\frac{1}{5-2}\{(2,280-2,356)^2+(2,530-2,423)^2+(2,460-2,490)^2+(2,600-2,557)^2+(2,580-2,624)^2\}
=\frac{21910}{3}


さて、帰無仮説H_0c=0とし、対立仮説H_1c \ne 0とします。
このとき、
T=\frac{67}{\sqrt{ {\hat{\sigma}}^2 / \sum_{i=1}^5 (i-3)^2} }
=\frac{67}{\sqrt{2191/3}}=2.479 \cdots
が自由度3のt分布に従うことになります。
一方
t_3(0.025)=3.182
なので、
有意水準5%で、帰無仮説H_0棄却されないことになります。


余裕のある方は、この問題のクレーム頻度の方や、例題77についても試してみる*3とよいと考えます。

*1:ちなみに他の科目のテキストを試験範囲にしていた例は過去にはあって、年金数理で生保数理のテキスト(二見氏)の第16章が範囲になっていたこともありました。今見直してみると外れているようですが。

*2:これは昔体験した話ですが、相関係数0.2いくつとかで「○○な代理店は△△だ」(○○と△△の中身はもう忘れてしまいましたが)という結論を出そうとされていた方がいて、無相関の検定 http://actuary.upthx.net/pukiwiki/index.php?1.1.2.2.4.t%CA%AC%C9%DB%A4%CB%BD%BE%A4%A6%C5%FD%B7%D7%CE%CC#sc1df85c を行ったら当然ながら帰無仮説相関係数が0)が有意水準5%くらいでも棄却できなかったという話があります。

*3:これらの問題ではlogの計算が入り普通の電卓では無理なので、試験本番ではlogの数値が与えられたものと想定して取り組むことになります。