2009.4.2
投手成績として記録されている“勝利”、“敗北”は、投手個人の能力の表れとするにはあまりにノイズの大きい数字です。
勝利数というスタッツが全く使えないとは言いません。プロの水準を満たさないような投手に勝利数が稼げないのはもちろんですし20勝などの数字は相当に優れた投手でなければ残せないものです。しかし上記のような要因は投手が実力でどうにかできない(少なくとも過去については統計的にどうにかできた形跡がない)ものであり結果に与える影響の程度がとても大きいのは確かです。また、そもそも降板した時点のリードが保たれる必要があるなどの条件は投手それぞれの投球結果を客観的に評価するものというよりは恣意的な基準に過ぎません。これらの要因により、奪三振率・被本塁打率・与四死球率のような投手・打者間で完結する数字の再現性に比べ投手の勝率の再現性は非常に低いものとなっています。
勝利数・敗北数は伝統的な価値観ではありますが、それを完全に投手個人の技能に因る数字だと考えたりすると野手その他の影響を無視しある種DIPSなんかより遥かに急進的な理論となってしまう、という論理的な問題もあります。
セイバーメトリクスではなるべく外的要因の影響を受けずに投手を評価する指標の構築が進められています。そのひとつがRSAAであったり、DIPSであったりするわけですが、今回は「先発投手の勝利」に類する概念を軸に評価について書いてみようと思います。
クオリティ・スタート(QS)というのは広く用いられている先発投手用の指標。
定義はある先発登板の結果が6イニング以上かつ3自責点以内であること。その条件を満たしたときに投手にQSが与えられます。概ね先発として「試合を作った」ことの評価に用いられており、シーズン全体でのQS数や先発登板数に対するQS達成の比率は先発投手が仕事を果たしているか見るのに適した指標であるとされています。この結果は(実質的に甚だしく程度が小さい影響は無視するとして)リリーフ投手や打線の能力に左右されません。
QSは、何よりも複雑でなく扱いやすい点がとても優れていると思います。「試合を作ってくれる先発」はどのチームにも求められるものですし、6回と3点という基準も、細かいことを言えば日本ではこの指標の出身地であるMLBと投手起用の方針や得点環境がいくらか異なるので疑問もあるにはありますが、簡便的な指標としてはそれなりに納得がいきます。
ただし、これはクオリティ・スタートの利便性と裏返しの問題ですが、評価としては大雑把なものであると言わざるを得ません。
6回3失点、これはQSです。9回1失点、これもQSです。QS達成という意味では同じですが後者のほうが価値の高い結果であることは疑いようがありません。この違いを評価に反映させたければ(簡便性を捨て)また別の指標を持ち出す必要があります。
SNW(Support-Neutral Win)という指標があります。Baseball Prospectusという組織の投手評価指標で、クオリティ・スタートのように控え投手陣や打線の影響を排除して投手を評価することを目的としています。
その計算方法ですが、仮に先発投手が7回無失点で降板したとすると、その日の援護点やその後の試合結果に関わらず一般的に7回無失点で投手が降板した場合の勝率はどうか?が統計的に求められ、その場合の勝率が85%だったとすると0.85を勝利数として先発に与える、といった具合です。走者を残していたとしても同じことで、投げたイニング数・許した失点数・残した局面を過去の結果に照らし標準的な打線とブルペンで獲得できる勝率の分を貢献とします。
クオリティ・スタートをもっと詳細にして二極の評価ではなく重みを与えたような指標です。前述の例を使うなら6回3失点と9回1失点を比べて後者のほうが良いと言うだけではなく「どれだけ良いのか?」という疑問にも答えてくれます。
SNWについてはJonah Keri, Baseball Prospectus, Baseball Between the Numbers: Why Everything You Know About the Game Is Wrong, (Basic Books, 2007)という書籍に収録された論文に書かれており、SNW自体とても優れた指標であることはもちろんですが、解説となっている文の内容も示唆に富んでいます。
重要な点は「得点は等価値に生み出されるものではない」というものです。例えば既に10点を失っているチームが11点目を失ったとしても、どっちにしろその試合はほぼ間違いなく負けでありその1点は大して問題ではありません。しかし、3点に抑えているチームが4点目を奪われることは試合の結果に大きな影響を持つケースが多いと考えられます。同じ1点でも「11点目」と「4点目」は勝利確率への影響が全く異なります。
筆者はこれを根拠に防御率が全ての点を等価値で扱うことを問題視しており、SNWなどの指標がこの問題を解決するとしています。確かにこの指摘は非常に納得できるものです。防御率では一度の不調な登板で大量失点をしてしまった投手について勝率への影響以上に低い評価をしてしまうかもしれません。またそこまで極端な例でなくても、6回3失点が2度と6回6失点・6回無失点が1度ずつでは防御率は同じですが実際勝率に与えた影響の合計値は異なるのではないか、など。
一般的によく利用されるRSAAにしても失点率ベースですから全ての失点は等価値であり、当サイトが以前より公開している期待勝利のデータも、ある程度のわかりやすさはあるのではないかと考えておりますが同様の問題を孕んでいます。
SNWの手法が説得力が高いらしいのはわかった。それをNPBに適用できるか……というと、そもそも基準となる値を算出するのに膨大な統計データが必要ですし、投手がどのような状況で降板したかなどの詳しいデータも調べるのに骨が折れます。
ではちょっとしたデータや理論からそれに類する目安を作成したりすることはできないか?などと考えたのが以下です。元となる考え自体は以前からあったのですが、SNWに触発されて膨らませてみました。
キーワードとなるのはイニング数、失点数、ピタゴラス勝率。
残した走者の状況まで細かい情報は扱いにくいので無視し、獲得したアウトの数(=イニング)と許した失点から標準的な打線と控え投手でその試合にどれだけの勝率が期待されるかを計算してみました。
仮に標準となる得点数を1試合平均4.50とします。打線には言うまでもなく4.50得点が期待され、ここで先発投手が7回2失点の投球をしたとすると、後から出てくる投手はイニングあたり0.5(4.5/9)の失点を期待されるので残された2回を投げる間に1失点を許し、先発の失点と合わせて4.5得点・3失点という結果を得ます(期待値ですので4.5得点などが実際にあり得ないことはここでは問題にはなりません)。
この結果を得失点から勝率を見積もるピタゴラス勝率式に当てはめると68%となります。0.68は言い換えれば勝利の期待値であり、SNW風に言えばこれを0.68勝として先発投手に与えることが考えられます。
評価としてどのように適用するかは少し後回しにしてまずは上記のような計算を27アウト毎と0~8失点に対し行ったマトリクスを示します。
INN | Out/Run | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1th | 0 | .500 | .409 | .338 | .282 | .238 | .203 | .175 | .152 | .134 |
1th | 1 | .517 | .423 | .349 | .290 | .245 | .208 | .179 | .156 | .136 |
1th | 2 | .535 | .437 | .360 | .299 | .251 | .214 | .184 | .159 | .139 |
1th | 3 | .554 | .452 | .371 | .308 | .259 | .220 | .188 | .163 | .142 |
2th | 4 | .573 | .467 | .383 | .318 | .266 | .225 | .193 | .167 | .146 |
2th | 5 | .593 | .483 | .396 | .328 | .274 | .232 | .198 | .171 | .149 |
2th | 6 | .613 | .500 | .409 | .338 | .282 | .238 | .203 | .175 | .152 |
3th | 7 | .634 | .517 | .423 | .349 | .290 | .245 | .208 | .179 | .156 |
3th | 8 | .655 | .535 | .437 | .360 | .299 | .251 | .214 | .184 | .159 |
3th | 9 | .677 | .554 | .452 | .371 | .308 | .259 | .220 | .188 | .163 |
4th | 10 | .700 | .573 | .467 | .383 | .318 | .266 | .225 | .193 | .167 |
4th | 11 | .723 | .593 | .483 | .396 | .328 | .274 | .232 | .198 | .171 |
4th | 12 | .746 | .613 | .500 | .409 | .338 | .282 | .238 | .203 | .175 |
5th | 13 | .769 | .634 | .517 | .423 | .349 | .290 | .245 | .208 | .179 |
5th | 14 | .792 | .655 | .535 | .437 | .360 | .299 | .251 | .214 | .184 |
5th | 15 | .815 | .677 | .554 | .452 | .371 | .308 | .259 | .220 | .188 |
6th | 16 | .838 | .700 | .573 | .467 | .383 | .318 | .266 | .225 | .193 |
6th | 17 | .860 | .723 | .593 | .483 | .396 | .328 | .274 | .232 | .198 |
6th | 18 | .882 | .746 | .613 | .500 | .409 | .338 | .282 | .238 | .203 |
7th | 19 | .903 | .769 | .634 | .517 | .423 | .349 | .290 | .245 | .208 |
7th | 20 | .922 | .792 | .655 | .535 | .437 | .360 | .299 | .251 | .214 |
7th | 21 | .940 | .815 | .677 | .554 | .452 | .371 | .308 | .259 | .220 |
8th | 22 | .956 | .838 | .700 | .573 | .467 | .383 | .318 | .266 | .225 |
8th | 23 | .971 | .860 | .723 | .593 | .483 | .396 | .328 | .274 | .232 |
8th | 24 | .982 | .882 | .746 | .613 | .500 | .409 | .338 | .282 | .238 |
9th | 25 | .992 | .903 | .769 | .634 | .517 | .423 | .349 | .290 | .245 |
9th | 26 | .998 | .922 | .792 | .655 | .535 | .437 | .360 | .299 | .251 |
9th | 27 | 1.000 | .940 | .815 | .677 | .554 | .452 | .371 | .308 | .259 |
結構キツキツな表となっていることをご容赦下さい。セイバーメトリクスに慣れた人にはどこかWin Expectancyテーブルに見えるかもしれませんし、実際ここでは狭義のそれです。
Out/Runの下、縦の0から27の数字は奪ったアウトの数。横の0から8は失点の数を指します。
例えば5回3失点の投手を評価したい場合、5回終了までの15アウト、3失点のところを参照します。すると.452と出ていますので、これが「5回3失点の守備内容を含む場合におけるその試合の標準的チームの勝率(勝利期待値)」です。理論上は先発投手以外の要素はニュートラルであり勝率.500となるはずなので、この場合先発投手が5回までに3点を失ったことによりチームの勝率をやや下げたということになります。
この表は、比較的簡単なものではありますが先発投手の結果がどれくらいの評価に値するものであるかの目安程度にはなってくれるのではないかと思います。また標準となる得点率さえ設定すれば誰でも表計算ソフト上に作成することができるものであり、パークファクターを考慮して低い得点レベルでの数値をシミュレートしたり、控え投手のレベルを低く設定したり……という改変も容易に行えるという点で手軽かと思われます。
今回の表では勝率.250未満になる範囲を赤、.250以上.500未満の範囲を茶、.500以上.750未満の範囲を青、.750以上の範囲を緑に着色しています。赤の範囲は問題外の「バツ」投球として、青か緑の投球は合格点範囲と判断してもいいかもしれません。ただしこれはわかりやすさのための色分けにすぎません。
表を使いつつここまでに出て来た争点を確認してみます。
といったように、投手の登板結果についてアウトと失点のみから色々と評価することができるのではないかということです。5回無失点などはあまり見ないように思われますが起きたとすれば思ったより評価に値するものかもしれません(ただし、後述する内容と関連しますがイニングを消費するということは重要なことです)。ちなみにこれ、裏を返せば○回までに○得点した攻撃側の勝率になります。
続いてこれを実際に投手の評価に適用してひとつの「結果」を出してみたいと思いますが、その前にこの手法について現時点で明らかな欠点も補記しておきます。
もちろん他にも問題点は考えられますが主観的に特に重要と思われるものを記しました。以上の問題点はどの程度重大であるかの具体的な検証は行っていません。
いざ評価法として構築する際「当該投球結果による勝利期待値を貢献として付与する」という方法はそのままでは使えません。
単にアウト数と失点数という意味では先発して先頭打者をアウトに取り降板したとしてその時点の勝率は.517ですが、この投手は0.517勝分の貢献をしたと評価するに値するでしょうか? この投手に6回3失点や8回4失点より高い貢献値を付与すべきとは考えにくいですし、そういった方法を取る場合投手交代が多いとチームの合計「勝率付与」が無闇やたらに膨れ上がってしまいます。
そこで残された勝率の完成にどれだけ寄与したかということを野球の単位であるアウト数から計算し勝率に乗算することにします。仮に6回3失点なら、0.50の勝利期待値があり、かつその試合全体の期待値は6/9だけその投手が固めたものであるので、0.50×(6/9)=0.33のように計算します。0.5勝の成立に2/3の割合で貢献したということです。これは複数の投手により勝利が成立させられた場合勝利貢献をシェアするような形になるので、チームの勝利を代表者一人に与えるような通常の“勝利”より先発投手個人については小さいスケールの数字になることを覚悟しておかなければなりません。もちろん、完封なら確実に勝てる上に一人の手柄なので1勝を得ますしアウトカウントを奪っていなければ失点をしていなくても貢献はゼロです。
成立割合の概念を取り入れた投手勝利寄与表は以下のようになります。
INN | Out/Run | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1th | 0 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
1th | 1 | 0.02 | 0.02 | 0.01 | 0.01 | 0.01 | 0.01 | 0.01 | 0.01 | 0.01 |
1th | 2 | 0.04 | 0.03 | 0.03 | 0.02 | 0.02 | 0.02 | 0.01 | 0.01 | 0.01 |
1th | 3 | 0.06 | 0.05 | 0.04 | 0.03 | 0.03 | 0.02 | 0.02 | 0.02 | 0.02 |
2th | 4 | 0.08 | 0.07 | 0.06 | 0.05 | 0.04 | 0.03 | 0.03 | 0.02 | 0.02 |
2th | 5 | 0.11 | 0.09 | 0.07 | 0.06 | 0.05 | 0.04 | 0.04 | 0.03 | 0.03 |
2th | 6 | 0.14 | 0.11 | 0.09 | 0.08 | 0.06 | 0.05 | 0.05 | 0.04 | 0.03 |
3th | 7 | 0.16 | 0.13 | 0.11 | 0.09 | 0.08 | 0.06 | 0.05 | 0.05 | 0.04 |
3th | 8 | 0.19 | 0.16 | 0.13 | 0.11 | 0.09 | 0.07 | 0.06 | 0.05 | 0.05 |
3th | 9 | 0.23 | 0.18 | 0.15 | 0.12 | 0.10 | 0.09 | 0.07 | 0.06 | 0.05 |
4th | 10 | 0.26 | 0.21 | 0.17 | 0.14 | 0.12 | 0.10 | 0.08 | 0.07 | 0.06 |
4th | 11 | 0.29 | 0.24 | 0.20 | 0.16 | 0.13 | 0.11 | 0.09 | 0.08 | 0.07 |
4th | 12 | 0.33 | 0.27 | 0.22 | 0.18 | 0.15 | 0.13 | 0.11 | 0.09 | 0.08 |
5th | 13 | 0.37 | 0.31 | 0.25 | 0.20 | 0.17 | 0.14 | 0.12 | 0.10 | 0.09 |
5th | 14 | 0.41 | 0.34 | 0.28 | 0.23 | 0.19 | 0.16 | 0.13 | 0.11 | 0.10 |
5th | 15 | 0.45 | 0.38 | 0.31 | 0.25 | 0.21 | 0.17 | 0.14 | 0.12 | 0.10 |
6th | 16 | 0.50 | 0.41 | 0.34 | 0.28 | 0.23 | 0.19 | 0.16 | 0.13 | 0.11 |
6th | 17 | 0.54 | 0.45 | 0.37 | 0.30 | 0.25 | 0.21 | 0.17 | 0.15 | 0.12 |
6th | 18 | 0.59 | 0.50 | 0.41 | 0.33 | 0.27 | 0.23 | 0.19 | 0.16 | 0.14 |
7th | 19 | 0.64 | 0.54 | 0.45 | 0.36 | 0.30 | 0.25 | 0.20 | 0.17 | 0.15 |
7th | 20 | 0.68 | 0.59 | 0.49 | 0.40 | 0.32 | 0.27 | 0.22 | 0.19 | 0.16 |
7th | 21 | 0.73 | 0.63 | 0.53 | 0.43 | 0.35 | 0.29 | 0.24 | 0.20 | 0.17 |
8th | 22 | 0.78 | 0.68 | 0.57 | 0.47 | 0.38 | 0.31 | 0.26 | 0.22 | 0.18 |
8th | 23 | 0.83 | 0.73 | 0.62 | 0.50 | 0.41 | 0.34 | 0.28 | 0.23 | 0.20 |
8th | 24 | 0.87 | 0.78 | 0.66 | 0.54 | 0.44 | 0.36 | 0.30 | 0.25 | 0.21 |
9th | 25 | 0.92 | 0.84 | 0.71 | 0.59 | 0.48 | 0.39 | 0.32 | 0.27 | 0.23 |
9th | 26 | 0.96 | 0.89 | 0.76 | 0.63 | 0.52 | 0.42 | 0.35 | 0.29 | 0.24 |
9th | 27 | 1.00 | 0.94 | 0.82 | 0.68 | 0.55 | 0.45 | 0.37 | 0.31 | 0.26 |
これを評価指標とするには、各投手について登板ごとのアウト数・失点数を調べ当てはまる勝利寄与値を記録していくという形です。
NPB公式サイトのデータから瞬時に算出できるような類のものではありませんがそもそもそういった指標からの脱却を目指すことがコンセプトですのでこれは仕方ありません。
ここまでの過程で成立した評価指標をPitching Win Value Added(PWVA、投球により付与した勝利価値)と呼称し、2008年非常に優れた成績を残し沢村賞の受賞でも物議を醸したダルビッシュ有と岩隈久志について計算してみます。ただし本稿の主題は解析手法そのものであり、これは成果を示すためのモデルにすぎないことをご承知下さい。
Pitching Win Value Added=打線と控え投手を平均的とした場合の、自らの登板結果を含むその試合のチーム勝率×試合完成寄与率
選手 | 統計 | W% | IP% | PWVA | VAAA |
岩隈 久志 | 合計 | 20.57 | 22.41 | 16.95 | 5.74 |
平均 | 0.73 | 0.80 | 0.61 | 0.21 | |
標準偏差 | 0.21 | 0.13 | 0.23 | 0.18 | |
ダルビッシュ 有 | 合計 | 19.01 | 22.30 | 17.25 | 6.10 |
平均 | 0.76 | 0.89 | 0.69 | 0.24 | |
標準偏差 | 0.19 | 0.16 | 0.24 | 0.19 |
で、算出してから気付いたのですが、この二人はいずれにしろ凄すぎて新しい解析のサンプルとしてあまり意味がない感があります。むしろもう少し不安定な投手について「実際どのくらい働いてるんだ?」と見極めるツールになるはずなのですが、この二人は安定感がありすぎて登板ごとの成績の分散も少ない。
一応説明をつけますと、W%は登板内容に期待されるチームの勝率、IP%はイニング数を9で割ったもの、PWVAは前述の通り、VAAAはPWVAから平均的な投手に期待されるPWVAを引いたもの(平均的なチームにおいて、平均的な投手が投げる場合に比べてチームにいくつ多くの勝利をもたらしたか)。
自力で勝ち取った貢献分という意味では若干ダルビッシュが優れていたという結果になったようです。守備力やパークファクターの補正をすると調度互角くらいになるのかもしれません。なお、岩隈のPWVAは「21勝したけれども実際には17勝程度の価値の投球内容だった」ということではありません。PWVAではリリーフ投手にも勝利が分配されるため異なる意味の数字となっています(岩隈の21勝が投球内容に対して過大か過小かとは別の話)。
ちなみに今回示した2種類のマトリクスは試合展開を考慮しているわけではないので、わかりやすさの問題もあり先発登板の例を軸に話を展開しましたがリリーフ投手に適用することも別に問題はありません。その場合も単に奪ったアウトの数と許した失点数のみが対象となります(どの回から登板したかは無関係)。仮に2回を無失点に抑えるリリーフをしたとして、打線や先発投手が平均的とみなせばその試合チームには.613勝が期待されます。結果的には単純に失点期待値の一部を固有の成績で置き換えているということに過ぎません。
今回の意図は具体的な指標の提唱というよりは、組織による統計データがなくとも勝率を利用した貢献度の目安はいくらかの理論的なヒントから得られるのではないか……という、見方の提案に近いものです。
今後このようなものを基準に評価法を発展させていくことがあるかもしれませんし、ないかもしれません。ここに記述した考え方が丸々不適切なものとして訂正される可能性もあります。しかしひとまず、算出された勝利貢献値はRSAAを勝利数に変換した数字とは若干異なる結果であることは確かであり得点という単位の縛りから視点を開放する一助になる可能性があるものと考えています。
補足
ピタゴラス勝率というのはここでは 得点^1.83÷(得点^1.83+失点^1.83) と計算されています。ふたつのマトリクスはいずれも得点率4.50を基準として算出され、ダルビッシュ・岩隈の比較の場合については2008年のパ・リーグ平均失点率4.28を使用しています。
またページ内で「失点」「自責点」という用語を野球規則や指標の定義に沿わずに使用している箇所があり、「失点」は単にわかりやすく「点数」の概念を表す意味で扱っている場合が多いことをご了承下さい。
トップ > 分析・論考 > 投手評価の目安