2010.2.17
野球の守りにおいて、投手というのは特別です。打者にボールを投げるのは投手だけで、野手の守備は打者が球を打ってから始まります。捕手を除けば、投手が打者に打たせない限り守備の出番は回ってきません。とはいえ実際には多くのアウトは野手が成立させているもので、投手以外の要素も守備では大きく関わってきます。
ではこの両者(投手/守備者)がどれだけの割合で守備全体に貢献をしているのか。これは非常に難しい問いです。それなりに三振を取れる投手でも全アウトのうちの三振の割合は1/4くらいですから残りのアウトを取る守備はとても重要なようにも思われますし、しかし投手ごとの防御率の偏差などに注目すると投手個人というものが失点の要因には大きな比重を占めているようにも思われます。
セイバーメトリクスの世界でもこういう問題は研究されている形跡はありますが、文句なしの答えが見つかりましたという報告は今のところ見ていません。せめて細かい条件を排除したりある特定の部分への注目に限ったりした上ででも、何か参考となるものさしを作れないものでしょうか。
また、ひとくちに投手と守備といっても、投手ごとに奪三振率は違います。基本的に奪三振は投手の実力によるものとみなせますが、三振を多く取る投手とそうでない投手は守備から受ける影響が異なるはずで、それはどのくらいなのでしょうか。
これらのことを調べるには、例えば奪三振・与四死球・被本塁打などほぼ守備の関与がないとみなせる項目について似通っている成績の投手データが多くあればある程度は検証可能かもしれません。投手としての要素が似ているのに成績にばらつきがあれば、それは守備からの影響だと考えられるからです。しかしそれには非常に膨大なデータが必要ですし、現実のデータでは要因を推測するのにあまりにノイズが大きすぎることが懸念されます。
従って、検証をするには帰納というよりは演繹から、失点に対して投手と守備がそれぞれどれだけの影響を持っているかを条件ごとに導き出す理論的なモデルを構築することが望ましいと思われます。もしそれがあれば前述のような疑問に部分的にでも答える参考となり得るかもしれません。
ここでは、なかなか決定版と言えるものを出すのは難しいことを承知で、演繹的に投手と守備それぞれの影響度についてのモデルを構築することを試みます。数学的に適切でない操作をしているところもあると思いますので、実験程度に見て下さい。
論点を単純に整理します。私が調べようとしているのは以下の2点です。
野球の守備において投手・野手それぞれの影響度は
1.一般的にどの程度か?
2.投手の奪三振率によってどのように変化するか?
そして今回はこれを、投手と野手それぞれの要因が失点に与える影響の大きさによって測りたいと思います。すなわち、野手によって失点が変化する余地が少ないのであれば野手の影響が少ないと考えるということです。
奪三振率のクラスごとに投手の要因による失点の変動、野手の要因による失点の変動を計測し割合をとればさまざまな場合の影響度が見えてきます。平均的な奪三振率での数値が一般的な割合を示すことになるでしょう。
単純化された世界なのはご了承いただくとして、アウトを起点として失点の要因となる事象がどのように発生していくか基礎的な部分から考えていきます。奪三振率だけを任意に決定するものとし、それ以外の要素は平均的なものとして固定します。
まず、1試合は27アウトですから、投手がひとつも三振を取らない場合は、野手が打球から27のアウトを取らなければなりません。あるいは、7個程度の三振を取るとしても、20のアウトは野手が成立させる必要があります。27から奪三振率を引いた値が野手に求められるアウト数です。ここで、野手が打球をアウトにするといってもいつでもアウトにできるわけではありません。ボールインプレーにはどうしてもヒットが内在しますから、モデルとしても.300のBABIPを見込むことにします。すると、野手が成立させなければならないアウトひとつにつき0.43本のインプレー安打(単打または二塁打または三塁打)が発生します。
さらに投手としても三振以外を全てボールインプレーで済ませられるわけではなく、本塁打を打たれてしまうこともあれば四球を与えてしまうこともあります。これらの事象は三振を奪う間の、あるいは野手がアウトを奪う間の対戦打席あたりに潜在するものと考え、近年のNPBの平均的な数値から打席あたりに発生する確率を設定します。平均的な被本塁打率(9イニングあたりの被本塁打)は0.9、与四死球率は3.2ですから、平均的な奪三振率のときにこの数字になるようにしました。
以上のように設定していくと、インプレーアウト・インプレー安打・本塁打・四死球といった失点を説明する主要な要素が奪三振率の関数として求まってきます。仮定の上で、奪三振率だけからその他の事象がどの程度発生するかが決定されるということです。
表にすると以下のようになります。
K/9 | IPouts | IPhits | HR | BB | RA | Pitching Responsibility |
0 | 27 | 11.6 | 1.0 | 3.4 | 6.30 | unknown |
1 | 26 | 11.1 | 1.0 | 3.4 | 6.02 | unknown |
2 | 25 | 10.7 | 1.0 | 3.4 | 5.73 | unknown |
3 | 24 | 10.3 | 1.0 | 3.3 | 5.46 | unknown |
4 | 23 | 9.9 | 0.9 | 3.3 | 5.18 | unknown |
5 | 22 | 9.4 | 0.9 | 3.3 | 4.91 | unknown |
6 | 21 | 9.0 | 0.9 | 3.2 | 4.65 | unknown |
7 | 20 | 8.6 | 0.9 | 3.2 | 4.39 | unknown |
8 | 19 | 8.1 | 0.9 | 3.1 | 4.14 | unknown |
9 | 18 | 7.7 | 0.9 | 3.1 | 3.90 | unknown |
10 | 17 | 7.3 | 0.9 | 3.1 | 3.66 | unknown |
11 | 16 | 6.9 | 0.9 | 3.0 | 3.42 | unknown |
12 | 15 | 6.4 | 0.9 | 3.0 | 3.20 | unknown |
13 | 14 | 6.0 | 0.8 | 2.9 | 2.98 | unknown |
14 | 13 | 5.6 | 0.8 | 2.9 | 2.76 | unknown |
15 | 12 | 5.1 | 0.8 | 2.9 | 2.56 | unknown |
16 | 11 | 4.7 | 0.8 | 2.8 | 2.36 | unknown |
17 | 10 | 4.3 | 0.8 | 2.8 | 2.17 | unknown |
18 | 9 | 3.9 | 0.8 | 2.8 | 1.99 | unknown |
19 | 8 | 3.4 | 0.8 | 2.7 | 1.82 | unknown |
20 | 7 | 3.0 | 0.8 | 2.7 | 1.66 | unknown |
21 | 6 | 2.6 | 0.8 | 2.6 | 1.51 | unknown |
22 | 5 | 2.1 | 0.7 | 2.6 | 1.36 | unknown |
23 | 4 | 1.7 | 0.7 | 2.6 | 1.23 | unknown |
24 | 3 | 1.3 | 0.7 | 2.5 | 1.11 | unknown |
25 | 2 | 0.9 | 0.7 | 2.5 | 1.00 | unknown |
26 | 1 | 0.4 | 0.7 | 2.5 | 0.91 | unknown |
27 | 0 | 0.0 | 0.7 | 2.4 | 0.82 | unknown |
RAは各要素から求められた失点率。繰り返しますがここで任意に変化させているのは奪三振率だけで、それ以外は仮定によって奪三振率から自動的に求まるものです。
さて、これで基本的な準備が整いました。ここで行うこととは結局、表でunknownとなっているPitching Responsibility(投手の責任)の値を求めて埋めていくことです。
このために、それぞれの事象が失点に与える影響度(得点価値)と発生の確率を求め、機会あたりの失点の標準的な変動を計算します。
そしてそこから野手の責任であるインプレーの事象を除き、投手が責任となる奪三振・被本塁打・与四死球だけからの変動を同様に計算。全体としての変動と対比させます。これが今回考えたPitching Responsibilityであり、失点の変動のうちの何割を投手の要因が握っているかということを表します。
Pitching Responsibility = 投手による失点の変動÷全体としての失点の変動
このように計算する投手の影響度は、当然奪三振率が上昇していくほどに増していくと考えられます。投手以外(野手)による失点の変動というのはインプレー打球がアウトになるかヒットになるかということですが、それによる失点の変動の余地はインプレーの機会が減るほどに減少していくからです。1からPitching Responsibilityを引いた分が守備の影響度。
Pitching Responsibilityの値を奪三振率のクラスごとに求め、グラフにまとめたものが以下です。
グラフでは細かい数字がわかりにくいため表としても掲載しておきます。
K/9 | IPouts | IPhits | HR | BB | RA | Pitching Responsibility |
0 | 27 | 11.6 | 1.0 | 3.4 | 6.30 | 54.6% |
1 | 26 | 11.1 | 1.0 | 3.4 | 6.02 | 56.7% |
2 | 25 | 10.7 | 1.0 | 3.4 | 5.73 | 58.7% |
3 | 24 | 10.3 | 1.0 | 3.3 | 5.46 | 60.6% |
4 | 23 | 9.9 | 0.9 | 3.3 | 5.18 | 62.6% |
5 | 22 | 9.4 | 0.9 | 3.3 | 4.91 | 64.4% |
6 | 21 | 9.0 | 0.9 | 3.2 | 4.65 | 66.3% |
7 | 20 | 8.6 | 0.9 | 3.2 | 4.39 | 68.1% |
8 | 19 | 8.1 | 0.9 | 3.1 | 4.14 | 69.9% |
9 | 18 | 7.7 | 0.9 | 3.1 | 3.90 | 71.7% |
10 | 17 | 7.3 | 0.9 | 3.1 | 3.66 | 73.5% |
11 | 16 | 6.9 | 0.9 | 3.0 | 3.42 | 75.3% |
12 | 15 | 6.4 | 0.9 | 3.0 | 3.20 | 77.1% |
13 | 14 | 6.0 | 0.8 | 2.9 | 2.98 | 78.9% |
14 | 13 | 5.6 | 0.8 | 2.9 | 2.76 | 80.7% |
15 | 12 | 5.1 | 0.8 | 2.9 | 2.56 | 82.6% |
16 | 11 | 4.7 | 0.8 | 2.8 | 2.36 | 84.4% |
17 | 10 | 4.3 | 0.8 | 2.8 | 2.17 | 86.2% |
18 | 9 | 3.9 | 0.8 | 2.8 | 1.99 | 88.0% |
19 | 8 | 3.4 | 0.8 | 2.7 | 1.82 | 89.9% |
20 | 7 | 3.0 | 0.8 | 2.7 | 1.66 | 91.6% |
21 | 6 | 2.6 | 0.8 | 2.6 | 1.51 | 93.3% |
22 | 5 | 2.1 | 0.7 | 2.6 | 1.36 | 94.9% |
23 | 4 | 1.7 | 0.7 | 2.6 | 1.23 | 96.4% |
24 | 3 | 1.3 | 0.7 | 2.5 | 1.11 | 97.6% |
25 | 2 | 0.9 | 0.7 | 2.5 | 1.00 | 98.7% |
26 | 1 | 0.4 | 0.7 | 2.5 | 0.91 | 99.5% |
27 | 0 | 0.0 | 0.7 | 2.4 | 0.82 | 100.0% |
平均的な奪三振率のクラス(約7)を参照すると、一般的に投手の持つ失点への影響度は全体に対して68.1%であるということになります。さらに、奪三振率0から27までのあり得る可能性の間で54.6%から100%までの幅があることもわかります。
先発投手であれば奪三振率は4.0から10.0までの間にほとんど収まりますから一般的に投手の責任範囲は62.6%から73.5%だと言えるでしょう。
このモデルは簡略的なものではありますが、ここで採用しているような要素があれば実際の野球の得点も高い精度で予測できることは確かですから、得点を説明するのに重要な要素は拾っていると考えられます。
さて、この結論が妥当であるかということを論じるのは実際のところ困難です。ひとつの参考として一般的な感覚や他のセイバーメトリシャンの研究と照らし合わせてみましょう。
まず一般的な感覚としてですが、守備が良いチームでも未熟な投手が投げていればなかなかアウトを取れないような状態は発生しますし多少守備がザルでも優れた投手であればそこそこの失点数にまとめられたりする状況があることから、「投手が重要である」ことには概ね納得がいくし言説としてもそのようなものが多いのではないかと思います。
客観的・合理的な説明を目指すセイバーメトリシャンはどう言っているでしょうか。Bill JamesはWin Sharesという総合評価指標で、平均的な投手と守備をやはり67.5%/32.5%といった具合で分割してそれぞれ貢献を付与しています。Bill Jamesはこの数字の根拠を説明していないとされていますが、いずれにしろセイバーメトリクス界隈では「投手に2/3程度」と言われることが多いのは事実のようです。※1 James以外の例では、David GasskoはPitching Runs Createdという指標の説明で今回私が示したような奪三振率の水準ごとの投手の責任をグラフに表していて(というより、私が先行するDavid Gasskoの研究に強い影響を受けていることを言っておかなければなりません。PRCの記事は非常に興味深いものです)、そこでも平均的な投手へのクレジットは69%となっており、これもまた近い数字です。ただし残念ながらDavid Gasskoの算出についても詳しい手順の説明は見つけられませんでした。※2
結局のところ一般的な感覚や他のセイバーメトリシャンの研究と照らし合わせた結果としては、大体一致しているのではないか、ということです。これは直接に論理的な意味を付加するものではありませんが、複数の研究により同じ傾向の結論が出ているということはその背景の一貫した摂理の存在が示唆されている可能性があるのかもしれません。
ところで、鋭い読者の方は既になんとなくひっかかっておられるかもしれませんが、序論やWin Sharesの例では「貢献」という言葉を問題にしたわりに、作成したモデルでは失点の変動への「影響度」を測っただけです。このふたつは、同じではありません。影響の要因を支配している者ならその分野の貢献を受け取ることができるのではないか考えることはそれなりには筋が通ると思いますが、ひとつの仮説です。変動を与えていない部分でも全体にとって不可欠な貢献をしている場合はあります。
例えば企業経営で、経理部が要因となった利益の差というものが企業ごとにあまりないと仮定しても、では経理部が企業の営業活動に貢献していないかというとそういうわけではないという話です。貢献しているのだけれど、企業ごとに利益に与える影響は均衡していて差が出てこないということかもしれません。ある要素が全体に関与していないなら変動を与えないし貢献はないでしょうが、変動を与えないから貢献がないとは限らないということです。
この研究で今後捕まえたいのはここで、投手が多く失点の変動へ影響を持っているということを理論的に明らかにしていくこと自体は投手を重視すべきかということの指針になりますから有用であると考えますがそれをどう評価システムに応用していくかはまだはっきりしません。
投手と守備が失点に対してそれぞれどの程度の影響を持っているかということを事象の得点価値・確率から計算し、平均的には投手が68.1%の割合で比較的大きな影響を持っているという結果が得られました。また奪三振率が高いほど投手が占める影響の割合は上昇していき、一般的にあり得る範囲はだいたい62.6%から73.5%です。
この結果は、一般的な感覚やその他のセイバーメトリクスの研究とある程度一致しているものと思われます。
今後の課題としては最後に少し書いた評価システムへの応用と、モデルそのものの検証です。影響度の測り方は他にも考えられるでしょうし、今回のような方法をとるとしても奪三振率に対する被本塁打率・与四死球率の変化の具合を変える、BABIPを投手と守備で分担する、走者の進塁の阻止や塁上のアウトを考慮する、など改変は考えられます。
※1 ちなみにBill JamesはWin Shares発表の数年後(2008)にもまた投手が何割の失点を防いでいるのかというほぼ同じ内容に言及しておりその記事がTHE FIELDING BIBLE VOLUME IIという書籍に収録されています。そこでは"What exactly the percentage is I don't know(その割合が厳密に何割かはわからない)"とした上で"but the Runs Saved by pitchers must be somewhere between 2/3 and 3/4 of all Runs Saved.(しかし投手によって防がれる失点は全体の2/3から3/4の間だろう)"と述べています。
John Dewan, THE FIELDING BIBLE VOLUME II, ACTA Sports, 2009, p.385
※2 David Gasskoが投手が受け取る貢献の割合を表すグラフを示したのは以下の記事です。
David Gassko, "Pitching Runs Created Again," The Hardball Times, 2006
トップ > 分析・論考 > 投手が持つ影響度のモデル