タンゴの回帰式
2013.4.6 by Baseball Concrete

1.観測値と能力値

 選手の成績と能力は、通常関連付けて語られます。普通、出塁率.370の打者は.320の打者より能力がある(あった)ものとみなされます。「高い成績を上げる力」が能力の定義なのだとすれば、これは定義的に当然のことと言えます。

 しかし、ある打者が年間(たとえば500打席)で残した出塁率が.370だったとして、それがそのまま「.370の能力の打者だ」ということにはなりません。「指標の信頼性と平均への回帰」で説明した古典的テスト理論によれば、観測された数字はランダムなノイズを含んでいます。

 観測値=真の値+誤差

 誤差というのは、厳密な定義を考えずにざっくりと言えば偶然の影響のことです。イチローでもヒットが打てない試合はあるわけですが、その場合の5打数無安打という成績をもって「全く能力のない打者だ」と断じる人間はいないでしょう。またその要因についても、後付けで色々な説明をつけることは可能でも、体系立てた理論で事前に予測できないのなら、予測不能な様々な要素が複雑に絡まり合って結果に影響してくる現実的な意味での「偶然」におさまるものと言えます。

 5打数というごく小さな機会数ならわかりやすいですが、これが100打数、500打数になっても「程度」の問題はあれ「成績が偶然の影響を巻き込んでいる」ことは変わりません。このため、統計データを扱う上で、単純な観測値と選手の能力は分けて考える必要があります。


2.能力の推定

 上記のような問題意識の下、セイバーメトリクスでは「観測した率(observed rate)」「回帰した率(regressed rate)」の区別は極めて重要になります(以下では「指標の信頼性と平均への回帰」で述べた内容を前提として議論を進めるため、内容が掴めない方はまずそちらをお読み下さい)。

 ここで、回帰した率とはなんなのでしょうか。古典的テスト理論では観測値の分散は真の値の分散と誤差の分散の和です。観測値は誤差を含む分だけ真の値に対して分散が膨らんでいるため、これを調整することで分散の大きさを真の値の持つ水準に合わせる作業をします。この調整をした値が回帰した率で、単純な観測値に対して能力の推定値にあたります。分散が小さくなるということは、観測値が平均値へ近づく(平均へ回帰する)ということです。

 結局のところ、観測値から能力値を推定するには観測値を平均に回帰させなければならないことがわかります。

 問題は、どのように、どれだけ回帰させればいいのか、です。

 回帰した値の計算式が次のものであることを考えると、信頼性をいかに算出するかが問題となります。

 回帰した値=信頼性×観測値+(1−信頼性)×観測値の平均

 例えば打撃成績のある年と次の年の相関(year-to-year-correlation)を信頼性だと考えるとわかりやすいでしょう。550打席の集団を前提として、年度と年度の間の相関係数が.65なら、観測値を.65、平均値を.35で重み付けして合計したものが回帰した値すなわち能力の推定値になります。このような計算を「35%だけ平均へ回帰させる」などと言ったりします。


3.タンゴの回帰式

 さて、ここまでは一応統計学の基本的な考え方に沿って素直に出てきます(間違っていたらご指摘下さい)。しかし、回帰の計算をさらに一般化しようと考えると壁に突き当たります。具体的には、打席数の異なる選手に対してどのように計算すればいいのかという問題です。

 誤差の分散が観測値の分散に占める割合は(真の値の分散の大きさとともに)サンプルサイズに依存します。5打席の成績が選手の能力をうまく反映しない一方で、5000打席の成績は選手の能力を強く反映している可能性が高く、回帰の必要性は乏しいです。つまり、50打席の選手と500打席の選手と5000打席の選手とを一様に「35%平均へ回帰させる」のは間違っています。では、それぞれの打席数に対する適切な回帰の度合いはどうすればわかるのでしょうか?

 ここで登場するのが「タンゴの回帰式」ことセイバーメトリシャンのTangotigerが重用している計算式です。

 信頼性=打席/(打席+定数)

 この式は、先程の回帰した値の計算式に当てはめて考えると、回帰の計算をするときには打席数に対して一定の数の平均的な打席を足せばいいのだ、ということを意味しています。出塁率の例で言えば、550打席を対象として信頼性が.65なら

 .65=550/(550+定数)

 であり、これを定数について解くと、定数は296と求められます。言い換えれば、選手の打席数がいくつであれ、296の平均的な打席を足せ、ということです。この式のいいところは、この定数さえ出てしまえば計算が非常に簡便で実用性が抜群なところです。

 例えば50打席なら信頼性は
 50/(50+296)=.14

 300打席なら
 300/(300+296)=.50

 1500打席なら
 1500/(1500+296)=.84

 とただちにその打席数に対する信頼性が計算でき、どれだけ平均へ回帰させればいいのかがわかります。

 Tangotigerはこの式を多くの場面で使用しており経験的にもよく機能することが知られています。実は筆者もこの計算方法は書籍『セイバーメトリクス・リポート』や当サイトで紹介している成績予測の算出に用いておりますが、これがどう作り出されたのか、どうして成り立つのかはいまひとつはっきりしないものとされています。分析上重要なところですし、公開している成績予測についての説明責任という意味も込めて、タンゴの回帰式の説明を試みたいと思います。


4.ごく簡単な証明

 証明、といっても筆者が考えたのはごく簡単な数式の操作です。式の正体を云々するよりも、もしタンゴの回帰式が適切ならば、古典的テスト理論の式から出発して自然にタンゴの回帰式の形に持って行けるはずだと考えました。

 出発点・古典的テスト理論:
 信頼性=真の値の分散/(真の値の分散+誤差の分散)


 目的地・タンゴの回帰式:
 信頼性=打席/(打席+定数)


 下準備として、誤差の分散はひとつの試行が成功・失敗というふたつの結果に分かれる二項分布であれば「p×(1−p)/n」であることを利用して「誤差の分散」を「P/打席」としておきます。Pはpと(1−p)の積で、とりあえずこれは定数として取り扱うことにします。

 信頼性=真の値の分散/(真の値の分散+P/打席)

 この分数をタンゴの回帰式に近づけるためには、分子に打席数が出て来る形にしたいので、分子と分母両方に打席数を乗じます。

 信頼性=打席×真の値の分散/(打席×真の値の分散+P)

 今度は分子に真の値の分散があることは邪魔なので、分子・分母に対して割り算してこれをどけてみます。

 信頼性=打席/(打席+P/真の値の分散)

 これだけの操作で、「P/真の値の分散」を定数と考えれば、たしかにタンゴの回帰式が出てきました。

 ちなみにブログ「Sabermetric Research」を運営するPhil Birnbaumというセイバーメトリシャンもタンゴの回帰式を取り上げて「打席数が異なる選手に対して、いつでも同じ数を足すのでいいのか?」という問題意識のもと検証を行っています。結果としては、筆者が行ったのと同じように「P/真の値の分散」の項が出て来てこれは選手の打席数に依存しないからタンゴの手法は正しい、という結論になっています。


6.おわりに

 より数学に強い分析家が厳密に証明をすると、タンゴの回帰式はベイズ統計的な計算の簡便法という位置付けになるようです。一定の仮定を置いた上での簡便計算、という感じでしょうか。ただしその厳密な計算を理解・検証することは筆者の能力を超えておりますので、ここではそれほど厳密なことを言わなければ古典的テスト理論から見てタンゴの回帰式の形は自然であることを確認した、という形で締めたいと思います。






トップ > 四方山話 > タンゴの回帰式

inserted by FC2 system