得点を勝利に換算する

1.得点数を勝利数に換算する必要性

 セイバーメトリクスの指標では、選手が生み出した利得は得点(失点)の形で表されることが多いです。
 例えば打撃指標のRCは打者が創出した得点数ですし、投球指標のRSAAも平均的な投手が投げる場合に比べて防いだ失点数です。得点という単位が重宝される理由としては、さまざまな要素の集大成としての勝利・敗北をいきなり扱うよりは得点という側面だけを切り出しておくほうが指標の構築や分析の上で扱いやすいし単位としてもわかりやすいということがあるでしょう。
 しかし、「基本的な考え方」項で述べている通り野球の試合の目的は勝利ですから得点だけを対象に取った分析だけでは場合によっては不十分で、得点という単位から得られた分析を最終的な勝利に関連付ける研究が別個で必要となります。

 例えば「成績予測の研究と成績の得点化の指標から、来季の当チームには700得点500失点という結果が見込めることがわかった。来季は球団としてはなんとか優勝したいところで、そのために大掛かりな補強を行ってきたが、これではまだ不十分だろうか。明らかな費用対効果の悪さを受け入れてまでさらなる補強を敢行すべきだろうか」と悩む球団首脳がいるとします(心配しなくても多分こんな事態にはならないと思われますが)。この場合の悩みは得点と失点が勝利に関連付けられていない、すなわち得点と失点がわかっても結局どれくらい勝てるかがわからないことに起因するのであって、得点と失点を勝利に換算する方法があれば悩みを解消する意思決定の指標となり得ます。無論それで100%の確信が持てるようになることはないですが、指標とは見当をつけるためのものさしのことを言うのであって明らかにないよりマシです。こういうところに「得点を勝利に換算する」意義があるわけです。

 個別の選手評価においても最終的には得点数を勝利数に換算して評価するという考え方は重要です。常に1点が1勝に対して等価であればいちいちこのことを気にする必要はあまりないのですが、平均得点が低いシーズンはリーグにおいて1勝に対する1点の価値が高まるという事情があることから、勝利という観点からするとあるリーグの「+20得点」が別のリーグの「+15得点」より利得として大きいことの保証はありません。このことに対応するためには、普遍的な勝利という単位にいちいち変換していく必要があるわけです。ですから当サイトの総合評価Total Winは選手を勝利数で評価しています。
 なお、このことは「ここ一番のホームラン」のような局面によって点数が勝利に与える影響が異なるという話とは別です。




2.ピタゴラス勝率とRPW

 当然、得失点を勝敗に置き換えるという研究はセイバーメトリクスの分野で早くから行われています。
 代表的なものがビル・ジェイムズによる「得点と失点からチームの勝率を予測する」ものであるピタゴラス勝率という計算式。

 ピタゴラス勝率=得点^2÷(得点^2+失点^2)

 「ピタゴラスの定理」を思い起こさせる不思議な式で、これだけでも得点と失点からかなり正確にチームの勝率を予測することができます。
 あまり数学的・理論的に構築された式に見えないためか好まれないことも多いですが、既に「得点力評価の前提」項で書いたように
 といった総得点と総失点からチームの勝率を予測する式としては論理的に妥当な性質を備えた上で実際に当てはまりもいい式となっています。結局野球は得点が上回れば勝利になるわけで失点より得点が多ければ勝利が多いと予測でき(逆もまた然り)、どのぐらいの得点マージンでどのぐらいの勝率が見込めるかの具合がよく当てはまる式があれば(理論的な背景としては不十分だと思われるかもしれませんが)指標として使えるわけです。
 得点と失点それぞれを2乗しているのは得点と失点の比の変化に対して勝率がどれだけ弾力的に変化するかの度合いを調整する役割を担っていますが、これに関しては後々開発者のビル・ジェイムズ自身やその他のセイバーメトリシャンによりさまざまな改良が加えられています。しかし式の基本的な形は変わらないままベストなRun-Winコンバーターのひとつとして広く利用されています。


 もうひとつ有名な式がピート・パルマーによるRPW(Runs Per Win)。「勝利をひとつ増やすのに値する得点数」という意味です。これを得点環境から計算し得失点差に適用すると、ピタゴラス勝率と同じように得点と失点から勝率を予測することができます。

 RPW=10×SQRT{(得点+失点)÷イニング}

 イニングあたりの両チームの得点の平方根をとり10倍するという計算式。こちらは統計的に導き出された近似式でしょう。記録される得点が多い場合には1得点は勝利に対して重要度が下がるということを示しています(RPWが高くなるということは、勝利をひとつ増やすのにより多くの得点が必要になるという意味ですから)。一般的にこのRPWは10前後になります。したがって、RCAAやRSAAが+10くらいの選手はチームの勝利をだいたいひとつ増やしたと考えられるわけです。このように得点を勝利に変えるのにわかりやすいというのはRPWのアプローチのいいところです。
 140試合戦って得失点差が+50のチームでRPWが10であれば、平均的な70勝(140の半分)に加えて5勝、75勝という結果が予測されます。当然、試合数で割れば勝率の形になります。

 ちなみに勝ちに接戦が多く負けに大敗が多かったりすると得失点に基づくピタゴラス勝率(あるいはRPWの予測勝率)のわりに勝率が良いということになるのですが、そういう得点と失点の噛み合せはセイバーメトリクスでは運の要素が強いと見るのが一般的です。チーム力とでも言うべきものは得点と失点のほうに表れていて、シーズン序盤の段階でチームの最終的な勝率を予測するには実際の勝率よりもピタゴラス勝率を用いたほうがいいという研究があります※1(シーズンが進むにつれて勝率とピタゴラス勝率のズレはピタゴラス勝率のほうに寄っていく)。

※1 Dan Fox, "Pythagoras and the White Sox," The Hardball Times, 2005



3.日本プロ野球における妥当性の検証

 それではピタゴラス勝率やRPWによる勝率の予測は現在の日本プロ野球においても妥当に機能するでしょうか。ここでは、2000年から2009年まで10年間のNPB12球団(延べ120サンプル)のデータを用いて実際に算出を行ってみたいと思います。また、比較検討の材料とするためにピタゴラス勝率とRPWだけではなくいくつかの式を加えます。計算する式は以下の6つ。



 なお、検証の対象がこれらの式である理由はセイバーメトリクスで一般的に使用されている勝率予測式がほぼこれらあるいはこれらに非常に近い類のものであり、この他に簡便な計算で求められる中でより正確とされるものを私は知らないということに拠ります。
 結果は以下の通り。

計算式相関係数標準偏差
Pythago.9074.749
Pythago1.83.9074.458
PythagoPat.9064.515
RPW.9054.506
得失点差.9014.466
得失点比.8924.661

 相関係数は実際の勝率との関係の強さを表し、標準偏差は予測と勝率の誤差を140試合換算したときの平均的な誤差です。つまり、ピタゴラス勝率による予測と実際の勝率は相関係数で言うと.907ほどの強い相関関係があって、ピタゴラス勝率から勝利数を予測すると140試合で4.749くらいの誤差が標準的に生じるということです。誤差は勝率ベースで言えば±3.2%前後。
 この結果からわかることはいくつかあって、まず、総得点と総失点で勝率の大部分を説明できること(ピタゴラスの決定係数で言えば82%)。一応これを言っておかなければなりません。そして、今回計算したいずれの式も得点と失点のみを用いて得点が上回るほどに勝率を高く予想する式であり、それらの間で相関関係にはほとんど違いが認められないこと。
 ピタゴラス勝率の中では初期のPythago(2乗のモデル)が最も誤差が大きく、緩やかに変化するよう調整した1.83乗のモデルが微妙ながら凝った計算式であるPythagoPatより優れた結果を出しています。
 その他ではRPWよりも単に得失点差を11で割る回帰モデルのほうが誤差が小さい結果となっています。ただし相関係数はRPWがほんの少しですが上であるところを見ると、やはり得失点に対する勝率の上下に関しては単なる得失点差だけではなく得点環境も考慮したほうがいいということが示されていると受け取れます。得失点比を使った予測は相関係数だけ見れば悪いものではありませんが他の手段があるならあえて使う必要はないもの。

 全体で最も相関係数が高く誤差が小さい優れたモデルはPythago1.83でした(ちなみに冒頭で触れたTotal Winでも現状Pythago1.83を採用しています)。ただしこの部分を掘り下げると実は1.83乗どころか1.65乗ぐらいにしたほうが誤差はさらに小さいということがわかっています。RPWと回帰式(得失点差)の関係からも言えることですが、日本プロ野球に当てはめる場合MLBで一般的に使用されている係数では得点の変化に対して勝率の変化が弾力的に対応しすぎているようです。現状では得点と勝利が緩く対応しているモデルを用いるほうが日本では誤差が小さく、この点は日米間の相違と見ることができるかもしれません。日米を比較する場合日本のほうが試合数がやや少ないために得失点の生産能力が最終的な勝率の結果に結びつきにくいということが要因となっている可能性は考えられますが、前出のDan Foxの研究によれば試合数が少ない段階でもMLBのほうが明らかにピタゴラス勝率による予測がよく当てはまっていることから、統計上の都合ではなく野球の内容の違いだと考えるのが自然かと思われます。
 要因がなんであるにせよ、MLBでよく言われる「10点で1勝」は日本では少し様子が違い、得失点と勝敗の関係について日米間で相違があることが窺えます。今後は米国で開発された指標を引っ張ってくるだけではなく日本の事情に合わせた勝率予測式の構築が求められるかもしれません。




4.結論

 得点数を勝利数に換算するということにはチーム力を評価したり選手評価を普遍的な単位に固定するという意義があります。そのための計算式にはピタゴラス勝率やRPWなどいくつかのものがあり、日本プロ野球に当てはめてみると今回検証した範囲では改良したピタゴラス勝率の式が最も当てはまりがよく誤差が小さいと言えます。
 また、得失点と勝敗の関係について日米で若干の相違が見られることから今後日本に合わせた式を開発する余地があると思われますが、これは直近10年のデータだけから得られた結論でありNPBについて通史的な検証を行えばまた結果は変わってくる可能性があることを補足しておきます。
 ちなみに冒頭で例として考えた700得点500失点のチームの勝率はPythago1.83を適用すると64.9%。一般的な優勝チームの勝率は6割程度ですから±3.2%の誤差を踏まえても順当に実力が発揮されれば優勝する確率は高いと言えるでしょう。








トップ > 四方山話 > 得点を勝利に換算する

inserted by FC2 system