簡単な走塁の指標を作る

1.攻撃の指標における「走塁」の無視

 OPSやRCは得点力を説明するための指標で、出塁と進塁を評価する計算式です。野球は塁に出て進塁することで得点になるのですから、これは当然のことです。
 しかし、OPSやRCを含め多くの打撃指標の基となる単打・二塁打・三塁打・本塁打・四死球などの記録はヒットを打って(あるいはボール球を選んで)打者がどの塁に出たのかということには詳しいのですが、一度塁に出た走者がその後どのように進塁したかという情報は持っていません。その結果、OPSやRCなどの指標は一度塁に出た走者がその後どのように進塁したかという意味での走塁を評価しないものとなっています。
 もちろん、盗塁というプレーについては記録されていますしRCなどは得点力をできる限り正確に表すため盗塁を取り込んでいますが、それは走者としての仕事の一部に過ぎません。例えば二塁に走者として出ているときに打者のシングルヒットで一気に生還するといったことは明らかに選手が実力で得点に貢献したとみなせる(盗塁に表れない)話であり、得点力の評価という観点からはそのことを評価する指標があってもいいものと思われます。
 盗塁以外では「得点(ホームベースを踏んだ回数)」という記録もありますが、これは自分の打った本塁打でのホームインなども含むものであり、そのままで「数が多いから走塁が良い」とは言えないものです。
 そこで、従来の記録に多少工夫を加えることで手軽に走塁を評価する指標が作れないかと考えたのが今回の記事です。




2.先行の研究

 セイバーメトリクスにおいて盗塁だけでない走塁を評価しようとする研究は以前からあります。参考のため代表的なものを紹介します。

 【Speed Score】
 Speed Scoreはビル・ジェイムズが開発した選手のスピードを評価するための指標。
 式の内容としては盗塁成功率、盗塁企図の多さ、得点の多さ、三塁打の多さ、併殺打の少なさを総合して選手の走力を表す、というようなもの。レンジファクターも要素として含めるのがオリジナルのようですが守備イニング数の公式データが得られませんし実際のところ算出の手順が煩雑で非常に面倒になりますから実質的にはレンジファクターは除外して算出するのが一般的です。
 というわけでレンジファクター要素を除外するとして、計算方法は以下。※1


 こうして得られる数値が選手のSpeed Scoreというわけです。細かい係数の根拠はよくわかりませんが、直接走塁能力を表す数値が得られない中で入手可能な記録をなんとか工夫して集めて指標にしようというビル・ジェイムズらしい意欲が見えます。結果の数字も0から10までのスコアとなり、なかなか見やすく親しみやすい数字となるところは魅力です。
 しかし、評価に混じる統計的なノイズは仕方がないとしても個人的にはSpeed Scoreに二点ほど不満があります。
 第一に、最終的な数字に実利的な単位(意味)が見出せないこと。例えば、Speed Scoreが10の選手は5の選手に比べて2倍足が速いということが言えるのか、あるいは得点という意味において5点分優れているということなのか。Speed Scoreはそういうことを教えてくれません。そのあたりが明確にならないとSpeed Scoreで差がついたとしてもそれにより選手をどう評価すべきなのかということが結局わからないのです。オリジナルがどのように発表されたのかの詳しいところを知らないために残念ながら詳細な「Speed Scoreの目指すところ」がわからないのですが、どうもSpeed Scoreが表すのは実用的な数字ではなく抽象的な「能力」に寄ったものであるように思われます(このこと自体は別に悪いことではありません)。
 第二に、計算手順が煩雑なこと。レンジファクターを要素から省くとしても正直なところ目安程度に計算するのは少々煩わしい式であるように感じます。
 やはりジェイムズ当人も走塁の数字をSpeed Scoreで満足することはなく、現在では自らのハンドブックにて以前は得られなかったより細かいデータを用いた走塁の指標を発表しています(その指標はThe Fielding Bible IIでの選手総合評価に取り込まれています)。

 【EQBRR】
 EQBRR(Equivalent Base Running Runs)※2はセイバーメトリクスを専門に行う機関であるBaseball Prospectusが算出・公開している走塁の指標。盗塁だけでなく走者として塁に出ているときに進塁の機会となるヒット・ゴロ・フライなどがどれだけあったかをカウントし、それに対する進塁をリーグ平均の走者と比較して利得を得点化しています。本当に詳細のところの計算式は不明ですが、おそらく「一塁走者として単打で三塁へ進む確率は平均で0.20だから、三塁へ進んだ場合には平均の走者より塁を0.80分多く獲得したことになる。そしてそれは得点期待値からすると0.30点の価値になる」というようなことをやっているはずです。
 公式記録からは得られない細かい進塁の事情を計測して打球ごとの不公平さを解消した上で得点という実利で評価しているため、現状非常に説得力が高く有用な走塁の指標だと思います。結果の数字はRCAAやRSAAなどと同様平均と比較しての得点ですから+5であれば平均的な走者が同じ機会を走る場合に比べてチームの得点を5増やしたということです。
 盗塁を含めずに計算したBatting Runsなどに単純に足し合わせれば、走塁を考慮した攻撃の指標となるでしょう。有用性ははっきりしています。
 問題があるとすればこれは個人では計算できない、詳細な記録が得られないNPBについては計算できないということですが、こういう指標があってくれることで「お手本」として参考にすることはできます。漠然と見るだけでも「『マネー・ボール』ではちゃんと研究されていない風だったけれども走塁で平均に比べて5点以上の利得を出すことも結構あるんだなぁ」といったことがわかります(ちなみに、イメージに逆らわずイチローはこの指標の数字が非常に優れている選手の一人です。2001年から2009年まで平均すれば年4.7点の利得を出しています)。




3.新たな指標の構築

 以上の議論を受けて「NPBで簡単に使える走塁の指標を作れないものか」という話に入りましょう。
 まず、私が重視したいのはEQBRRが表すような選手が生み出した実利です。RCやRSAAなどは全て直接的には実利を表そうとしていて、それが分析には有用です。「足が速いから三塁打が打てる」といったことは(Speed Scoreがしているように)走塁のスキルを評価する際には有用かもしれませんが、打者走者として三塁に進んだことの利得は既にRCに含まれているもので重ねて評価する必要はありません。
 そして実利を考えたときに絶対的に価値があるのはホームベースを踏んだ回数という意味での得点という記録です。結局は、走者として進塁して得点することを目指しているのですから。ただし冒頭に書いた通りそのままでは使えませんので工夫することを考えてみましょう。まず自身の本塁打での得点は走者としての活動の結果の得点ではないから走塁の評価からは除外するとして、「得点−本塁打」が目指すべき数字として考えられます。
 Speed Scoreはこの「得点−本塁打」を「安打−本塁打+四球+死球」で割ることで得点の評価としています。つまり「本塁打を除いて、出塁に対してどれだけの割合でホームへ生還したか」を評価しているわけです。これは非常に多くのノイズを含むとはいえ大まかには筋の通る話だと思います。これの応用で指標が作れそうです。
 ここで、細かい進塁の記録がなくても補正できると思われる問題は、同じ出塁といっても単打で一塁に出るのと二塁打で二塁に出るのとではその後の生還のしやすさが違うがこれは走者としての差ではないというところ。これを補正してみます。

 出塁する塁ごとの得点のしやすさを計るため、「コンピュータシミュレーションで野球を分析」より、2005年NPBの得点確率表を参照します。野球における走塁死の出現頻度からして得点確率(ある局面からその後少なくとも1点以上入る割合)の計算上での1点目はほとんどの場合先頭の走者によるものと考えていいでしょう。そうすると、例えば無死一塁で一塁走者が生還する確率は40.7%だと考えることができます。
 「先頭の走者が一塁走者」の局面はそれ以外に一死一塁と二死一塁のふたつがあり、一死一塁の得点確率は27.5%、二死一塁の得点確率は13.0%。一塁走者としての一般的な得点する確率を求めるにはこれらを平均する必要がありますが、それぞれの出現のしやすさが異なるために出現確率(NPBのデータが得られないためシミュレーションの値で代用)に応じて加重平均します。すると、一塁走者は一般に25.2%の確率で生還するだろうという結果が出てきます。
 同様の計算を「先頭の走者が二塁走者の局面」、「先頭の走者が三塁走者の局面」についても行うと、二塁走者が生還する確率は35.7%、三塁走者が生還する確率は50.9%となります。
 この結果を安打と四死球それぞれに区別して適用すると

 0.252×(安打−二塁打−三塁打−本塁打+四球+死球)+0.357×二塁打+0.509×三塁打
 簡単にすると  0.25×(安打−本塁打+四球+死球)+0.10×二塁打+0.26×三塁打

 という式が出てきます。この計算は細かくは塁に出てから得点することを適切に評価したものではないですが、一応出塁の内容ごとの得点のしやすさの傾向は考慮されるかと。これを「出塁から期待される生還の量」だとすると、それに対して走塁での生還(前述の「得点−本塁打」)が多い選手が優秀な走者だということになります。

 (得点−本塁打)/(0.25×(安打−本塁打+四球+死球)+0.10×二塁打+0.26×三塁打)

 これで一応出塁からの生還という意味での走塁を評価する式になります。結果的にはSpeed Scoreに含まれる得点評価要素を少し改造したものに過ぎませんが、そのぐらいの簡単さが私の目指したところです。走塁での得点のレートですから指標の名前は走塁得点率(英語ならBaserunning Score Rate?)とでもしておきましょう。
 Relativityを考慮して利得を算出するのであれば「(走塁得点率−リーグ平均走塁得点率)×(0.25×(安打−本塁打+四球+死球)+0.10×二塁打+0.26×三塁打)」とすればリーグ平均の走者と比較しての得点(すなわちEQBRRと同じ意味)になります。なお、念のためですが盗塁も出塁から生還を目指すための手段の一部でありこの指標に含まれています。

 さて、改めて走塁得点率を作ったことに何の意味があるのか、走塁得点率はSpeed Scoreと何が違うのか。
 私が挙げたSpeed Scoreの難点は「どういう意味の指標なのか扱いに困る」ということと「計算が面倒」というふたつでした。それらの点について走塁得点率のほうを見ると、出塁に対する得点の多さという明確な単位に基づいており計算は明らかにSpeed Scoreより簡単という違いがあります。Speed Scoreがある上で、走塁得点率はまた別の選択肢を提供します。




 

4.実用性の検証

 では実際走塁得点率は指標として役に立つのか?ということを検証しておきます。当然ながら走塁得点率をEQBRRのような走塁の指標として使うには問題が色々とあるわけです。


 以上のようなものがノイズとして評価に紛れ込んできます。で、それらが紛れ込む結果どれだけ使えるのか(or 使えないのか)。
 指標の意味として目指すところはEQBRRですので、EQBRRとの相関性で確認してみます。2009年MLBのデータを用いて、EQBRRを機会あたりの率に換算。EQBRRの機会数が200以上の選手(266サンプル)について機会あたりEQBRRと走塁得点率の相関係数をとると.609でした。多少の相関関係はある、と言えそうです。ちなみに同条件でEQBRRとSpeed Scoreの相関係数は.564ですから、走塁得点率は簡単ではあるけれどもEQBRRを予測するにはSpeed Scoreを使うより若干精度が高いということが少なくともこのサンプルについては言えます(相関係数の差としてはないも同然ですが)。


 実際に日本プロ野球に当てはめてみるとどうか。直近2年の規定打席到達者について算出を行いました。

2009セ・リーグ トップ5とワースト5
順位名前走塁得点率  順位名前走塁得点率
1 福地 寿樹1.624  25 和田 一浩 0.835
2 荒木 雅博1.613  26 金本 知憲 0.812
3 赤松 真人1.517  27 マクレーン 0.756
4 平野 恵一1.501  28 ラミレス 0.722
5 東出 輝裕1.269  29 相川 亮二 0.644

2009パ・リーグ トップ5とワースト5
順位名前走塁得点率  順位名前走塁得点率
1 片岡 易之1.580  28 フェルナンデス 0.827
2 渡辺 直人1.555  29 山崎 武司 0.778
3 田中 賢介1.375  30 里崎 智也 0.764
4 本多 雄一1.359  31 スレッジ 0.651
5 川崎 宗則1.322  32 田上 秀則 0.639

2008セ・リーグ トップ5とワースト5
順位名前走塁得点率  順位名前走塁得点率
1 東出 輝裕1.568  29 栗原 健太 0.802
2 赤星 憲広1.446  30 李 炳圭 0.784
3 荒木 雅博1.395  31 畠山 和洋 0.773
4 青木 宣親1.360  32 中村 紀洋 0.753
5 飯原 誉士1.321  33 矢野 輝弘 0.517

2008パ・リーグ トップ5とワースト5
順位名前走塁得点率  順位名前走塁得点率
1 渡辺 直人1.576  25 松中 信彦 0.942
2 片岡 易之1.541  26 日高 剛 0.844
3 森本 稀哲1.458  27 ローズ 0.802
4 坂口 智隆1.410  28 山崎 武司 0.735
5 西岡 剛1.378  29 スレッジ 0.643

 全体を見ると、なんとなく足の速い選手が上位に入り、走塁のイメージがない選手が下位に入っているような気もします。特に上位の選手は1番を打つような選手が多く、なるほどと思う面もあるものの、これは単純に打順が上位であるために後続の援護を受けやすく数値が高く出やすい、ということである可能性はあります。
 得点化を行うと上位の者は20点ほどの利得になり、この数字が明らかに過大であることもバイアスによるものであると考えられます。EQBRRに比べて分散の大きさは3倍にもなるため、走塁得点率の利得を強引にBatting Runsに足すような形で使うとしても3で割っておくなどの処理が必要でしょう。




5.まとめ

 多くの攻撃の指標は走塁を評価しないことから別途走塁の指標を作ることには意義があり、既存の指標では日本プロ野球についてその目的を果たせないと判断したため新たな指標を構築、そしてそれがある程度信頼のおける指標と相関関係があることを確認しました。
 私としては今回の指標の作成は遊び心から行った面が強く、例えばこれを総合評価に取り入れていこう、などといったことは一切考えておりません。それでも、NPBでも何か「走塁を数値化しようとした痕跡」みたいなものは残しておきたいと思ったわけです。もしかすると、何か他の分析を行う際に参考になる変数に成り得るかもしれません。








※1 Speed Scoreの算出にあたっては以下のページを参考とした
Dan Levitt, "Speed Scores and Reaching Base on Errors," BasebaLL Think Factory
Tom Ruane, "Figuring Speed Scores," BasebaLL Think Factory

※2 本家Baseball Prospectus用語集のEQBRR項目
Baseball Prospectus Glossary




トップ > 四方山話 > 簡単な走塁の指標を作る

inserted by FC2 system