打撃総合指標について
式が多くなって地の文とごちゃごちゃ混ざってしまったので
指標の式にあたる部分は文字を茶色にしています。


 打者評価の項で紹介しているRCやXRはご存知の通り創出したはずの得点をゼロから積み上げる指標です。
 それだけでは対象の打者がどのくらい優秀なのかわかりにくいので

 対象打者のRC−(リーグの打席あたりRC×対象打者の打席数)

 という形にして打席数ベースで平均的な打者との比較を行うRCAA・XR+という指標があります。
 そのように紹介しているのは知る限り指標の定義がそうであるからというだけですが、既存の定義にこだわらなければRCAAという指標名のAbove Average(平均以上に)の部分は別の考え方もできます。
 すなわちアウトあたりの得点創出。

 対象打者のRC−(リーグのアウトあたりRC×対象打者のアウト数)

 「アウト数」というのはRC27に倣って「打数−安打+盗塁刺+犠打+犠飛+併殺打」とか表すことができますね。
 最初の式では平均的な打者が同じ打席数で創出する得点と比較してのプラスマイナス、こちらの式では平均的な打者が同じアウト数を消費する間に創出する得点と比較してのプラスマイナスになります。
 どう違うのかといえば、個人的には得点力の実態を表すのは後者だと考えます。
 仮にチーム成績ということで考えて

チームアウト数打席長打率 出塁率得点
A3900 6000 .420.350 717
B3900 5821 .400.330 626

 というような2チームが存在するとします。
 野球における機会であるイニング数が同じなのでこのときAチームの、Bチームに対する得点力の高さは717点と626点の差分、91点と考えるのが自然です。
 打席あたりの計算を試すと
 717−(626/5821)×6000=71.75点
 ということになりますが、打席数を増やすこと自体も強打の作用であってそこの差異を捉えないのは得点力の実態とズレているように思われます。
 単純な話ですが、ここに「打席あたり得点創出」評価の疑問があります。
 ただし上記は考え方の一例であって、打者個人の評価をする際にそこをどう考えるかは好みの面もあるでしょう。
 野球はあくまでアウトに対して点を取っているのだというのがひとつ重要だという話で。


 ところで「基本的な考え方」のページで紹介しているBatting Runsなんですが

 BR = 0.47×単打+0.78×二塁打+1.09×三塁打+1.40×本塁打+0.33×四死球−0.25×(打数−安打)
  ※ただし−0.25の部分はリーグの打撃環境で補正して使う。また、ここでは盗塁を省いている。


 日本ではあまり見ないような気がします(セイバーメトリクス自体見ない、と言ってしまえばそれまでよ)。
 XRとの違いといえば最初からAbove Averageの形をしていること。それにしてもアウト(打数から安打を引いたもの)の係数が-0.25というのは意味がわかりにくいのかもしれません。

 ここで前述の「アウトあたり」の考え方でXR+(XRAA)を作ってみるとします。
 式は「対象打者のXR−(リーグのアウトあたりXR×対象打者のアウト数)」です。
 そして、考えてみればXRというのは実際の得点と一致するように作られている指標なのですから「アウトあたりXR」というのは要するに得点率ということになります。一試合(27アウト)の得点を4.40点程度が標準と考えるならば、1アウトあたり得点は約0.16。
 見やすくするためにXRの式を簡略化して書きますと

 XR = 0.50×単打+0.72×二塁打+1.04×三塁打+1.44×本塁打+0.34×四死球−0.09×(打数−安打)

 そしてアウト(打数−安打)にリーグのアウトあたり得点0.16が負の係数としてかかりますので「アウトあたりのXR+」は

 XR+ = {0.50×単打+0.72×二塁打+1.04×三塁打+1.44×本塁打+0.34×四死球−0.09×(打数−安打)}−0.16×(打数−安打)

 { }で括った中が対象打者のXRで、それ以降が同じアウト数を消費する間に平均的な打者が創出する得点を表した部分。
 最後に、アウトの部分はまとめられますのでそのように表すと……

 XR+ = 0.50×単打+0.72×二塁打+1.04×三塁打+1.44×本塁打+0.34×四死球−0.25×(打数−安打)

 非常にBRに近くなることがわかります。
 BRはある意味アウトベースのAbove Average指標と考えられるのかもしれません。XRとの違いは得点期待値を利用するために最初から標準的な得点を見込むという点。0.16をXRやRCのアウトにかければ標準的な得点期待値に対する増減に注目する指標になり、逆にBRのアウト係数から0.16を引いた場合積み上げ総得点を表す指標になります。
 ちなみに投手のRSAAもアウトベースのAbove Average指標ですよね。
 また「アウトあたりのRC」で改めて何かピンときませんか。RCをアウトで割る、これはつまりRC27です。打者個人のRC27は「1番から9番までその打者が並んだ場合に〜」という一見変な出力になるスタッツですが、RCAAをアウトあたりで算出すると考えると、そこでの機会あたりの貢献の高さはRC27に比例します。結局RC27はチームの得点増への貢献の高さを表すということです。

 アウトに関しては進塁させない価値などその場の局面に対するマイナスが0.10、アウトあたりに期待される得点を失ってしまうマイナスが0.15で合計0.25という説明が一般的なようです。後者を含めなければ実得点を表すし、含めればAbove Averageになるという関係。もちろん値は得点レベルにより変動し、考え方から言えば得点率5.00のリーグではBRのアウト係数はだいたい「0.10+(5/27)=0.285」となります。
 野球はアウト(イニング)の間に点を取っているので、アウトを奪われるということはそこに潜在する得点を奪われるということです。攻撃側が相手にアウトを与えるとき、目の前に形として見えなくても期待得点のマイナスは確実に存在するわけで、犠打などはそのことをきちんと踏まえた上で……なんて話にも繋がりますがここではそれをするつもりではないのでこの辺で。

 途中のまとめ。






 丸っきり自分の好みでやった「総合評価」のページでは、打撃の評価にBRを用いました。
 その理由は(1)得点期待値、そこから計算された加重という考え方がとてもわかりやすいこと(2)計算が複雑でないわりによく機能すること。
 XRとは非常に近いことを認めた上で何故新しいスタッツのXRでないのかというと、犠飛の加重などに評価としての疑問があり、また式を好みに合わせて改変しようにも重回帰というものにそう馴染んでいない人間には手を出しにくいという理由などがあります。
 BRにしてもまだ好みに合わせて手を加えたい部分はありますし、どちらにしても同じ様な結果を得ることにはなると思うのですが。

 RCとなるとちょっと事情が違います。リンク先の道作さんが詳しく解説されているように、積算モデルであるRCは攻撃手段の集中による得点効率の向上を表現します(この「得点効率」は便宜的に置いた言葉とご理解下さい)。では攻撃手段の集中による得点効率の向上とはどういうことか?
 イニング内の四球の集中ということで考えると、4つ以上の四球が出た場合、3人は残塁しますが4つ目以降の四球からはひとりずつ押し出されて得点になります。
 4四球の場合は1得点で、四球ひとつあたりの得点寄与は0.25(1/4)。これが100四球になると(100-3)/100が生還し四球ひとつあたりの得点寄与は0.97に上がります。安打等を含めて考えても同様に、基本的によく打つ環境ではイベントあたりの得点寄与は上がることになります。
 XRやBR(加算モデル)ではあたかも打撃イベントひとつひとつが絶対的に確かな価値を持っているかのように計算されますが、実際はそうではなく環境に依存しますよという問題。その意味で、XRは真に正しい得点予想式にはなり得ないのかもしれません。
 (余談:「安打/得点」とか「得点/XR」で打撃イベントに対する得点の多さを計算して何か巧みに得点を奪う技術が存在するかのように書く分析を書籍なんかでたまに見かけます。その式を持ち出すこと自体に問題はないと思いますがよく打つチームで自然と高く出やすいことはちゃんと認識されているのでしょうか。またそれを監督の評価とするのはかなり疑問があります)


 で、RCの話。
 よく打つチームとそうでないチーム、2例のRCを計算しそれぞれにシングルヒットの打席を足した場合に得点がいくら増えるかも合わせて計算してみます。

チーム打数安打塁打 四死球長打率出塁率RC 単打プラス1での得点増
C4654 1359 2208 578 .474.370817.45 0.64
D4685 1124 1631 352 .348.293477.93 0.52

 RCはBasicの(安打+四球)×塁打/(打数+四球)の式で計算。同じ単打プラス1でも打撃環境によって得点寄与が異なることが表れています。考えてみればその振舞いが自然であることは前述の通りですし、RCの式に納得がいかなくてもシミュレーションモデルなどで同じ挙動を見ることができます。これは野球の特徴を捉えていて、XRにない注目すべき美点だと思います。(ちなみにCは2004年のホークス、Dは2002年のベイスターズがモデル)
 しかしそのままで「それなら打者の評価にその式を使えばいいのね」ともなれないのが面倒なところで、RCはチームレベルの得点予想として非常によく機能することが知られており、それ故に個人にそのまま当てはめるのは適切とは言えないことになってしまいます。打線は9人で組むものなので一人の打者がチームの得点環境に与えられる影響はかなり限定的ですが、仮に(安打+四球)×塁打/(打数+四球)を一人の打者に当てはめれば打撃イベントの得点寄与はその打者が一人で打線を組んだ場合のそれであるように計算されてしまいます。
 なのでRCを個人に適用する際の運用方法として打者評価のページで紹介しているような

 RC = {(A+2.4×C)×(B+3×C)÷(9×C)}−0.9×C
  A = 安打+四球+死球−盗塁死−併殺打
  B = 塁打+{0.24×(四球−故意四球+死球)}+0.62×盗塁+{0.5×(犠打+犠飛)}−0.03×三振
  C = 打数+四球+死球+犠打+犠飛


 という長ったらしいやつがあるわけです。
 これは式自体は「出塁×進塁/機会」から全く動いていませんが、対象打者の得点創出を見積もるのに8人の標準的な打者と打線を組んだ場合の得点数を計算してそこから標準8人の得点創出分を除くという遠まわしな計算をしています。
 例えば500打席で出塁(A)220の選手がいるとすると、標準的な打線に1/9として加入した場合のチーム(A)は、同じ機会数500に標準的な出塁率0.330の選手を8人加えて、220+8×0.33×500 → 220+2.64×500 → 1540 と計算されます。
 同様に進塁ファクター(B)も、対象選手が塁打300で標準長打率が0.370なら 300+8×0.37×500 → 300+2.96×500 → 1780 と計算され、機会数は対象選手分に9をかけたもの。(A)1540×(B)1780/(C)4500 が標準的な8人の中に対象打者を入れた場合のチーム得点で、こうすれば対象打者の打撃がチームの打撃環境に与える影響は1/9になり、個人の評価にあたっては実際の事情に近くなる……と考えられます。
 チーム得点は609と出ましたが最後に標準8人の得点創出 8×0.33×0.37×500 → 0.9678×500 → 488.4 を除くので、対象打者一人の得点創出は(609−488.4)=120.6となります。
 普通に220×300/500と計算すると132になりますがこれは大袈裟だというわけです。
 今回の計算とRCで採用されている係数が微妙に異なるのは後々の式のAファクターやBファクターが「出塁率」「長打率」と同じでないことなどが理由ですが、基本的なやっていることは変わりません。
 得点環境に柔軟に対応する積算モデルの美点を持ちながら打者個人の得点創出の評価を可能にする補正と言えそうですが、このように使う場合加重は全体の平均的なものにならざるを得ないので結局はほとんど加算モデルと同じ結果を示してしまうという面もあります。
 また、得点環境により得点効率が変化する構造になっていること自体は確かですが、その塩梅については疑問が呈されてもいます。


 最近知られているもうひとつの得点予想式(積算モデル)がBase Runs(BsR)。
 これは同じ積算モデルでも「RCの式ってよくわかんなくね?プロリーグで総得点と近似するのはなんとなくの偶然だろう?詳しく見れば色々挙動おかしいぞ?」といった疑問に対応する力を持っているようで、「出塁×出塁した走者が生還する確率+本塁打」という式の構造をしています。
 wikipediaなどで見る式は以下のようなもの。

 Base Runs = A×{B/(B+C)}+D
  A = 安打+四球+死球−本塁打−0.5×故意四球
  B = {1.4×塁打−0.6×安打−3×本塁打+0.1×(四球−故意四球+死球)+0.9×(盗塁−盗塁刺−併殺打)}×1.1
  C = 打数−安打+盗塁刺+併殺打
  D = 本塁打


 Aは出塁、Bは進塁、Cはアウト、Dは本塁打を表しています。
 どうやら式の考案者はRCにしろなんにしろ肝は攻撃が集中するほどに出塁に対する生還の割合が上がっていくことで、それを「スコアレート」として打撃環境から見積もった上で({B/(B+C)}の部分)出塁にかけて、本塁打はセパレートで置くことにしたようです。
 出塁し、出塁・進塁が集中するほどに生還し、本塁打は本塁打の分点が入る。なかなか論理的ですね。進塁部分に係数が入ってくることは仕方がないと思います。
 先頭打者が1本の本塁打を打った時点の得点創出は、XRが1.44点、RCが1×4/1で4点(!)、しかしBsRなら正確に1点ですよというようなのがよくある説明。
 スコアレートが{B/(B+C)}という形になっているのは、出塁した走者が帰ってくるかに関しては全く帰ってこないか常に生還するかの間(最低で0、最高で1)であり、成功と失敗のうちの成功の割合で表せると考えられるからです。進塁に関して出塁や盗塁が成功でありアウトが失敗であることは言うまでもありません。
 かなり強力な式ではあると思います。

 ただしBsRも肝心のスコアレートの計算部分が経験則的なもので改善の余地があるという解釈が散見され、RCを「偶然」と突き放すにはその域をどれだけ抜けているかに関して疑問がないわけでもないです。煮詰めるとOERAと言われるような数理的なシミュレーションモデルに近くなるのかもしれません。
 またBsRはRCと同様に得点環境が打線のものとして計算されるので個人にそのまま適用できません。RCのように「理論上チーム補正」をすることも考えられますし、あるいは平均的なチームの打撃成績から対象打者の打撃成績を除き、前後のBsRの差をとるというような手法が用いられているようです。
 以下では試しに後者の手法を用いて得点創出を算出した上で「対象打者のBsR−(リーグのアウトあたりBsR×対象打者のアウト数)」でアウトベースのAbove Average値に変換、加算モデルのBRと比較するということを行ってみます。


2008年セ・リーグ400打席以上 平均は投手打席含む
選手打席打率長打率 出塁率OPSBRBsRAA 誤差
村田 修一554 .323.665.397 1.06259 61 2
ラミレス600 .319.617.373 .99051 49 -2
内川 聖一544 .378.540.416 .95644 44 0
金本 知憲623 .307.527.392 .91942 43 1
小笠原 道大589 .310.573.381 .95443 43 0
青木 宣親500 .347.529.413 .94242 40 -3
栗原 健太616 .332.515.389 .90438 36 -2
タイロン・ウッズ573 .276.527.377 .90335 33 -1
森野 将彦412 .321.556.394 .95031 33 2
吉村 裕基574 .260.525.313 .83719 23 4
福地 寿樹532 .320.449.366 .81522 22 0
赤星 憲広646 .317.347.398 .74518 20 2
阿部 慎之助484 .271.502.350 .85221 18 -3
和田 一浩560 .302.475.345 .82018 17 0
新井 貴浩410 .306.454.371 .82415 17 1
中村 紀洋557 .274.460.340 .80014 15 0
鳥谷 敬605 .281.411.365 .77612 14 2
飯原 誉士469 .291.434.351 .78513 13 0
アレックス605 .306.439.345 .78513 11 -2
畠山 和洋479 .279.406.364 .77011 11 0
関本 賢太郎521 .298.421.364 .78513 8 -5
シーボル431 .273.435.320 .7554 5 1
木村 拓也432 .293.406.347 .7535 4 -1
井端 弘和466 .277.368.340 .7081 0 0
田中 浩康604 .290.361.358 .7192 -1 -2
川島 慶三417 .255.357.329 .6861 -2 -3
宮本 慎也482 .308.355.354 .7090 -3 -3
李 炳圭448 .254.416.293 .710-4 -3 0
東出 輝裕576 .310.337.341 .678-7 -4 3
天谷 宗一郎443 .263.319.326 .645-9 -7 3
石原 慶幸457 .265.374.302 .676-8 -7 1
坂本 勇人567 .257.353.297 .650-13 -9 3
矢野 輝弘404 .275.358.305 .663-8 -10 -2
仁志 敏久535 .265.395.297 .692-6 -11 -4
平野 恵一452 .263.307.333 .640-8 -14 -6
金城 龍彦532 .247.339.297 .636-16 -15 2
荒木 雅博591 .243.301.292 .593-20 -18 2

 管理人の感想は「全然違う考えから出発して式を構築しているわりに結果は同じ様なもんじゃないか?」です。37サンプル中誤差の絶対値が5を超えたのは1例だけで、根本的な違いというより細かい係数の差異とかで説明がつくように見えるものも多いかと。
 得点環境の変化に対応しない点は加算モデルの欠点ですが、積算モデルを用いる場合でも評価を構築する中でほとんど加算モデルと同じ加重を与えることになってしまいます。言い換えれば加算モデルの欠点は評価の上で(少なくとも一般的な得点創出の見積をする限りでは)そう問題にはならず、実質的に「とてもよく機能する」ことが言えるのではないでしょうか。総合評価でBRを用いた理由(2)の根拠となります。
 別にどの式が最も良いかということを議論したいのではありません。様々な考えから様々な式が出てきてそれらが同じ結果に収束していくというのは美しく、良いことだと思うわけです。その分裏打ちになりますから。
 チームの実得点との誤差という検証ではRCもXRもBsRも非常に競っていますし、好みで使い分ければいいように感じられます。



 ということで、うだうだ語りながら色々な指標に触れようとしたわけですが長くなってしまいました。
 後半のまとめ。





トップ > 四方山話 > 打撃総合指標について

inserted by FC2 system