総合評価の算出方法

by Baseball Concrete

  1. 記録から定量的に選手の働きを評価する。
  2. 基本として公的に入手できる一般的なデータを使用する。
  3. 各選手の責任に因らないと思われる項目は評価の対象から除外する。
  4. 優れた結果・劣った結果の判断には「リーグ平均との差」を利用する。
  5. 結果への価値の評価は得点期待値の考え方を利用し平均的な加重をした上で勝利数に変換する。
  6. 絶対的な価値は平均的な選手が出た場合の積み上げ貢献に各選手の余剰勝利を加算したものと規定する。
  7. 結果が生まれた各局面の重要性といったものは無視する。
 という基本的な考えがあり、具体的な計算は以下。
  1. 打撃利得の算出
    1. Batting Runsを改変した式を打者に適用。
      0.47×安打+0.38×二塁打+0.55×三塁打+0.93×本塁打+0.33×(四球+死球)+0.19×盗塁-0.44×盗塁刺-ABF×(打数-安打+犠飛)
      ABF = リーグ全体の(0.47×安打+0.38×二塁打+0.55×三塁打+0.93×本塁打+0.33×(四球+死球)+0.19×盗塁-0.44×盗塁刺)/(打数-安打+犠飛)
  2. 守備利得の算出
    1. 守備位置ごとに異なる式を適用。
    2. 捕手
       盗塁阻止評価 = (0.44×盗塁刺-0.19×許盗塁)/守備イニング
       補殺評価 = (補殺-盗塁刺)×0.395/守備イニング
       捕逸評価 = 捕逸×0.33/守備イニング
       失策評価 = 守備率×0.49
      これらをリーグ平均と比較し総合。
    3. 一塁手
       {(0.4×補殺/被打球)-リーグ該当守備位置(0.4×補殺/被打球)}×被打球
       被打球 = チーム(対戦打席-本塁打-四球-死球-三振-外野刺殺)×(該当守備位置出場イニング/チーム守備イニング)
    4. 二塁手・三塁手・遊撃手
       {((0.2×刺殺+0.4×補殺)/被打球)-リーグ該当守備位置((0.2×刺殺+0.4×補殺)/被打球)}×被打球
       被打球 = チーム(対戦打席-本塁打-四球-死球-三振-外野刺殺)×(該当守備位置出場イニング/チーム守備イニング)
    5. 外野手
       中堅期待刺殺率 = リーグ{0.63×外野刺殺/(対戦打席-本塁打-四球-死球-犠打)}×0.34
       両翼期待刺殺率 = リーグ{0.63×外野刺殺/(対戦打席-本塁打-四球-死球-犠打)}×0.33
       BIP = チーム(対戦打席-本塁打-四球-死球-犠打)×(外野出場イニング/チーム守備イニング)
       0.63×刺殺-((中堅出場/外野出場)×中堅期待刺殺率+(左翼・右翼出場/外野出場)×両翼期待刺殺率)×BIP
  3. 得点を勝利に変換
    1. 打撃余剰勝利
       期待勝率 = (リーグ平均得点+打撃利得)^1.83/{(リーグ平均得点+打撃利得)^1.83+リーグ平均得点^1.83}
       (期待勝率-0.5)×リーグ試合数
    2. 守備余剰勝利
       期待勝率 = リーグ平均得点^1.83/{リーグ平均得点^1.83+(リーグ平均得点-守備総利得)^1.83}
       (期待勝率-0.5)×リーグ試合数
  4. 出場貢献分(Base)の算出と加算
    1. Base Batting = (リーグ総試合数/4/リーグ総打席数)×打席数
    2. Battiing Win = Base Batting+打撃余剰勝利
    3. Base Fielding =
       リーグ(総試合数/12/総守備イニング)×0.125×(捕手出場イニング+三塁出場イニング)
       +リーグ(総試合数/12/総守備イニング)×0.0833×(一塁出場イニング)
       +リーグ(総試合数/12/総守備イニング)×0.1667×(二塁出場イニング+遊撃出場イニング)
       +リーグ(総試合数/12/総守備イニング)×0.0917×(左翼出場イニング+右翼出場イニング)
       +リーグ(総試合数/12/総守備イニング)×0.1083×(中堅出場イニング)
    4. Fielding Win = Base Fielding+守備余剰勝利
  5. 総合貢献(Total Win)の算出
     Total Win = Battiing Win+Fielding Win




※スペシャルサンクス……野手の守備利得算出式は『日本プロ野球計量分析レポート&データ集』で発表されている“奪アウト率”を参考にしています。









総合評価案についての語りというかだべり

殴り書き、長い、読みにくい。


 計算について、なんでこんなことになっているかあんまり詳しく書いていないので、まぁこの案に限らずとも選手を評価する際の基本的な考えに関することになりますし、管理人の手法を少し面白いと思ってくれる人がもしいたとして、逆にくだらんと感じる人がいたとしてどっちにしろ根拠がよくわからなければ肯定も否定もしにくくて面白くないような気がしますのでちょっと思ったことを書いていってみようかと。

<打撃評価について>

 まず打撃に限らず基本的に、「リーグ平均との差」を求めることを徹底しようと考えました。
 選手の働きの価値を評価するには何らかの基準が必要で、プロ野球はリーグ内で戦っているものだから、その時のそのリーグ全体から見てどのような成績であるかを判断し影響を評価とすることが適当ではないかと。
 各イベントの加重などもそのような考えに基づき、「得点期待値」を重用しています。得点期待値は結局平均的に期待される得点の環境を表していますので、それへの影響を計ることで平均的な加重となることが見込まれます。

 ちょっと回りくどいですかね。まぁそこで登場するのがBatting Runsです。これは得点期待値に与える影響から各打撃イベントの価値を算出した打撃指標で、非常に評価のコンセプトに即していると言えます(もちろん実際はコンセプトがBatting Runsありき、という順番ですが)。
 シングルヒットを打ったら平均的に得点期待値に0.47点のプラスをもたらし、アウトになると-0.27程度……という具合に勘定され、最終的に平均的な期待得点にどれだけプラスをしたかという「平均との差」が表れます。
 で、式はネットで見つけたものをベースに犠飛を打数としてカウントし、盗塁を自前の係数に変えたりした形。
 犠飛についてですが、特別なものとして考慮する必要はないし打者へプラスの配分の必要もないと判断しました。
 例えば、ある打者Aはある日代打に出されて全力で打ちにいって外野フライに終わりました、打者Bも同じ様にある日代打に送られて外野フライに終わりました、というときに、どちらかのケースで三塁に走者がいて生還したとしても両打者の評価は同じにするのが公平だろうと管理人は思いますので。同様に併殺打も打者個人の責任としてはただの凡打と考えます。
 ただこの辺は考え始めると与えられた状況が違えば打撃の難易度・条件も変わるのだから同じ結果だったら同じ評価にできるわけはないということになるのですが、それについてはあきらめています。各打者を公平に評価することを目指した指標であることを考えた場合、難点として認識せざるを得ないと思います。ただし評価に重大なエラーを招かせるほどの問題だとは思っていませんが、それもはっきりとした根拠をもって示せるものではないのでなんとなくの域を出ません。

 そうそう、Batting Runsはリーグ平均要素(平均的な打者がアウトあたりにどれだけの利得を稼ぎ出すか)を計算した上で求めなくてはならないのですが、今回それにあたって投手打席を除いた値を用いました。
 この辺りコンセプトにそぐわない面があるような気がして現状微妙だと思っています。
 野球の試合が動いているその仕組みからすれば打者の守備位置がどこだろうと関係ないと思っていますので、例えば打撃利得の守備位置補正というような考えも導入していません。ただ実際の影響を計って、守備位置ごとの守備のバリューは守備のバリューとして加算することになります。
 そうすると現実にあった打席に対して特段区別を持ち込む必要はなく、あくまで全体との比較で得点への影響を計測すべきなのかもしれません。
 ただどうもセとパで落差が生まれるような気がして踏みとどまってしまいました。保留。

<守備評価について>

 基本的に獲得したアウト(刺殺・補殺)をベースに、これも平均との差。
 まず最初に捕手について言うと、刺殺の記録は奪三振によるものがほとんどで捕手個人が記録した奪三振が不明なことからその分を減じて用いることも不可能で使えないと判断した以外は、盗塁阻止・その他の補殺は責任守備結果と判断できるし捕逸・失策も招いてしまった損失と考えられます。
 被盗塁企図の少なさ、いわゆる「ホールド」を評価することも可能でしたが企図されることの損失は阻止率によりけりで、かといって補正を用いて運用するのも非常に現実の事情と誤差が大きくなると感じたのでただ単に実際にあった許盗塁・盗塁刺だけを評価することとしています。ランナーを留めることによるその他の影響もかなりブラックボックス。せめて「捕手の被打撃成績」が入手可能なら違うのですが。
 そう思うと若干面白い面もあり、加重方法からすると一定以上阻止率の高い捕手の場合走られれば走られるほど得になります。そんな警戒されていない捕手が大きな利得を出すというのはもしかすると変に感じるかもしれませんが、成功率の低い攻撃チームが無闇に企図を繰り返したら総得点を減じるだろうと考えれば自然かと。

 あとその他の野手。
 これについては、ゾーンレイティング(ZR)的な評価がわかりやすいだろうなと考えるところから入りました。
 要は被打球を高い割合でアウトにした野手が優秀であると。
 以前一般的な記録をどのように扱えばZRに近くなるかということを軽く探ったとき、遊撃手についてZRと高い相関を出すのは
 (補殺-併殺/2)/(打席-本塁打-四死球-三振)
 といった形の式でした。
 確かZRは(異なるバリエーションがあるのか知りませんが)内野手に関してゴロ処理だけを対象にしていたと思います。で、普通ゴロを捕球して一塁に送球してアウトといった場合遊撃手には補殺が記録されます。その他併殺関与で打球処理でない補殺が「併殺」の半分くらい。で分母のほうは遊撃手の責任範囲にどれだけ飛んできたかはわかりませんがチーム単位はBIPで見積もれますしシーズン単位で見れば各チーム遊撃手の周辺に飛ぶ割合はそうすごい違いは出ないだろうと考えられます。なので前述のような式がZRにある程度近くなるというわけです(差異は主に分母。遊撃手の責任範囲に飛んでくる割合がチームごとに「そうすごい違い」はなくとも確実な違いはあり、だからこそZRが必要なわけで)。
 ついでにチームの外野手アウトが多い場合それを補正してやるとより相関が高くなることに気付きました。要は投手がフライボールばかり打たせたチームは内野手の獲得アウトが減るけれどもそれはただ単に責任範囲に飛んでこなかっただけだということ。
 いくつかの方法が考えられますが単純にBIPから除くだけでも補正として働くと判断。
 あと(自分が打球処理でない)併殺での補殺も、技術の差のつきそうなところであるので利得とみなしてもいいかなぁと思って、ちょっと変えたのが以下の式。
 補殺/(打席-本塁打-四死球-三振-外野刺殺)
 係数もなくてシンプルでいいかとも思ったんですが、フライ処理による刺殺を全く無視するというのも思い切れなかったため、最後のところでやはりRFやFRのように含めることにしてしまいました。
 得点加重は、得点期待値で「何も起きていない」うちから安打を打たれる場合の損失。内野手の関与するような打球はあまり長打にはならないし走者を進める価値も低いとしてBatting Runsでのシングルヒットよりもやや低めの加重となりました。
 0.4×補殺+0.2×刺殺 で刺殺の加重が半分なのはアウトに価値の違いを見出しているわけではなく、刺殺のうち半分くらいは打球処理や当該野手の貢献によるものとみなせない(そうみなすと守備側の利得が現実の局面の変化に対して大袈裟に膨張してしまう)と考えているからです。刺殺の加重は「0.4×(刺殺/2)+0.0×(刺殺/2)」と表すのが考え方としては近い。ただこの辺は実際は二塁・三塁・遊撃それぞれ事情は異なりますしアバウトであると言わざるを得ません。刺殺を無視したほうがすっきりするとも思っているのですが、どうも断定しかねます。得点加重についても色々な説があり微妙。米国の守備指標なんかを見るにこれより2倍ほど大きい加重をしてもいいのかもしれません。「~という説もある」で終えるには大きすぎる違いですけど。
 失策についてですが、捕手以外には使えずアウトを取れなかったものは安打と記録されようが失策と記録されようが同じとして式に入れていません。
 一塁手については刺殺のほとんどがただ単に送球を受けるだけで記録されるもので、チームの内野ゴロの多さ・内野手の守備力の高さに依存してしまい一塁手個人の守備力評価に使えないものとして除外しています。「普通の一塁手なら捕れない難しい送球を巧みにキャッチ」とか「痛烈なゴロを横っ飛び捕球で自らベースを踏む」とかで記録される刺殺は一塁手のプラスプレイとみなすべきと思うのですが、判別は難しそうです。

 外野手については守備力の採り方はほぼ刺殺をBIPで割っただけです。打球処理=フライの捕球は直接アウト成立の刺殺に記録されますので。
 中堅・両翼についてははっきり区別することはせずそもそも同じ板の上で仕切りがあるわけじゃなく飛球を追っかけているんだからと同じ扱い。ただ中堅であるという条件の問題で打球処理の機会が増えることについて補正を行うこととし、自前で集計したボックススコアの打球データなどからだいたい33/34/33くらいの割合で中堅が有利だろうと決定。
 ただ根拠は弱く(単純に中堅と両翼の処理割合を見ただけでは、中堅手が優秀だからなのかなんなのかわからないので曖昧な推定が入っています)、しかもこのような定数での扱いはどうにもスマートでないので受け入れられにくいところかなぁと思います。
 外野を一緒くたに扱うこと自体に関してそれほど抵抗はないのですが、そもそもは刺殺のデータが左翼・中堅・右翼で区別されていないということからの苦肉の策ですし(苦肉の策といってもこの調節は久保氏の守備イニングデータが優れていたからできることで、それは幸運なことですが)。
 あともっと根本的な問題として、内野手の評価のときにはBIPあたりの外野刺殺をいわばピッチングスタッフのゴロ/フライ傾向の補正として使っていたのに、外野手評価となれば外野手の能力の判断に使っているわけで、おかしくね?という話があります。それぞれ単独で見るならいいとしても。
 結局外野刺殺が多いのは投手がフライを打たせたからなのか、外野手が優秀だからなのかどっちと取っているのかと。これについてもまぁどっちも混じっているだろうという曖昧な態度になってしまいます。
 プラズプレイズの得点加重は内野手より高い0.63。長打になることが多いのでアウトにできた場合とそうでない場合の差が大きくなります。具体的には外野への飛球が単打・二塁打・三塁打どれになるか平均的な割合を計算して加重平均したもの。
 なお、肩の強さについては補殺では計れないとして評価から除外しました。

<得点から勝利への変換について>

 上記の計算で求めたのは前述の通り「平均との差」の、“得失点”です。
 リーグ内での最終的な影響力を計測するには勝利数に変換してやる必要があります。
 これに関してはリーグの得点率から求めるRuns Per Win(勝利に値する得点数)という指標で割ってやるという手もありますが、「得点の2乗÷(得点の2乗+失点の2乗)」のピタゴラス勝率式を使用しています。
 ブログのほうに載せた時点よりやはりこちらのほうが好みに合うかなぁと思っています。
 その理由はいくつか。
 まず単純な話が、得失点から勝率を推定する手法としてよく実情を捉えているらしいという経験則。近年のチーム成績をサンプルにデータをとったところ、得失点差からRPWで勝利数を求めるよりピタゴラス勝率式を使うほうがわずかに誤差が小さいという結果でした。以前シミュレーションを行ってみたとき、理論上の勝率ととても当てはまりがよかったことも補強材料とします。
 あとはまぁその理由の話にもなるのかもしれませんが、「得点を増やすこと」と「失点を減らすこと」は同じ扱いにはできないんじゃないかという問題。
 140試合600得点600失点を標準と仮定するとして、ある点数を得点に加算しようが失点から減算しようがRPWシステムでは得失点差が問題なので同じ評価となります。少なくとも僕の知る限りの運用方法では。
 しかし例えば
 標準に超異常投手陣が加わりシーズンを10失点で乗り切ったとすると、600得点10失点で、敗戦はほとんどなさそうだし最大でも10にしかならなそうです。(失点を590減らした)
 標準に超異常打撃陣が加わり1190点を上げたとすると、1190得点600失点で、物凄く強いことに間違いはありませんが負けが考えられないというほどではなさそうです。(得点を590増やした)
 どちらも得失点差は同じ値ですが勝利の具合はおそらく違い、ピタゴラス勝率式では前者が.9997、後者が.797。失点を減らすほうが自チームに余剰利得が出るのと同時に全体の利得を減らし独占率を上げるために有効なものと考えられますが、ピタゴラス勝率式の振る舞いは余剰利得が勝敗に及ぼす影響をよく捉えていると感じます(そんなに大きく表れることはなくてもベクトルは同じはず)。
 運用の仕方次第なんでしょうけど、RPWの扱い方をこねくりまわすぐらいだったらピタゴラス勝率式のほうが簡単でベターなのかなと。
 そこから、守備利得+10なら600得点600失点を600得点590失点にする力と考えて、その差を勝利の利得としています。
 (ベースラインはリーグの平均得点を使うのが誤差が小さいというか公平になるだろうと考えます。しかしこの辺の問題は複雑に考え出すと複雑ですね)

<基準絶対値について>

 以上で求められるのは余剰の利得。わかりやすい形に変換するためとちょっと色々な補正のために、最終的には絶対的に積み上げた勝利の形にすることにしています。
 絶対的な貢献を考える際に利用するのも平均チームの仮定で、「全てにおいて平均のチーム」がシーズンを戦ったとすると余剰利得はどこをとってもゼロですがおそらく試合数の半分の勝利をあげます。となると「平均との差」はゼロだとしても試合数の半分の貢献はあるとみなさなければならないだろう、というふうに考えます。
 144試合なら72のWin。これを打者や投手がどのように分担しているかを考え、まず攻撃と守りに半分ずつ割り振りました(触れたばっかりの「得点増=失点減?」の問題もありますからこの時点から微妙なんですが、まずはわかりやすいしそう破綻することはないと思いますので)。
 9人で打線を分担すると考えたら一人の平均フル出場打者は36/9で4勝の貢献を得るということになります。このような機会を得る間にある打者が+2勝の打撃余剰利得を出していたら、絶対的な貢献は6勝とみなしていいでしょう。(同じ様な方法で得点の形をとるスタッツもあります
 まぁとにかく「出場機会あたりの平均的な積み上げ貢献+余剰利得(勝利)」が絶対的な勝利になるとしているわけです。

 ややこしいのが守備の貢献分配。平均的なチームがそこに存在するとして、それぞれの守備位置は勝利にどのくらい貢献することになるんでしょうか。
 ここではまずDIPSとDERを用いて、投手対守備で影響力の大きさがどれだけ違うのかを計測。2:1という結果が得られたので、2/3を投球に分配。
 残りの1/3について、各守備位置の影響力の大きさを守備指標の偏差だとかを用いて計測、若干(作為的とも言えないような)恣意的な手直しをして置いたのが以下の分配。

 平均チームで守備の12勝がどのように分配されるか
 投手(守備) 0.5
 捕手 1.5
 一塁手 1.0
 二塁手 2.0
 三塁手 1.5
 遊撃手 2.0
 左翼手 1.1
 中堅手 1.3
 右翼手 1.1

 まぁもう恣意的な手直しをしたって言っちゃってるんで成立してないとは思うんですが、後からWin Sharesとか見たところでは近からず遠からずといった感じのようです。
 だいたい説明がうやむやなことからもわかるとは思いますが手法にこれという裏付けもないということです。
 そもそも守備に貢献しているって一体どういうことなんでしょう。失点をしないのに重要な役割を果たしている、能力のない者に担わせた場合甚大な被害が出る、といった要素が考えられるような気がしますが、それは例えばリプレイスメント・レベルとの差といったものから計測できるのかというのはよくわかりません。
 ただ、単純にある守備位置における守備指標のプラスマイナスを見るだけでなくこのような考え方を導入して加えるのは新たなものも見えてきていいような気はします。Relativeの守備指標で同様にゼロだったとしても、平均的な一塁手より平均的な二塁手のほうが高い価値があると見ることもできると思いますので(比較不能、というのが慎重で正しい態度なのかもしれませんが)。
 「出場機会あたりの平均的な積み上げ貢献+余剰利得(勝利)」が絶対的な勝利となるのは無論打撃と同じことです。平均的な遊撃手なら年間で2勝の貢献になりますし、余剰で+1を出した捕手なら2.5勝になります。
 ちなみにこの分配では打撃:投手:守備のバランスが36:24:12(50.0%:33.3%:16.7%)となっており、マネー・ボールで引用されていた「守備の影響は5%」といった言説とは異なる結果になっています。


<その他課題とかことわり>

・打撃評価は伝統的なものだけれどもMLB基準
 Batting Runsの係数がね、基本的に流用ですからね。軽く統計をとるとか、演繹的に導き出すとかどうせだから何か日本に合った根拠を持つものを使いたい気もします。

・パークファクター補正がない
 かなり有利・不利は大きいので本当なら補正はしたいものです。ただ勉強不足で上手いやり方が思いつきません。何かとデータも必要になりそうです。

・守備評価周辺はかなり怪しい
 絶対値の分配も含めて。サイト内守備評価のページでRRFを算出しているのにそれを用いないのは、複雑であるということと、僕が言うのもなんですが正直いまひとつ決定的なものを感じないからです。MLBではUZRという守備指標が現状ベストに近いものとして評価されているようですが、そういう指標とRRFの相関ってどうなんでしょ。

・貢献を合計しても実際の勝利数にならない
 Win Sharesでは3ポイントが1勝に値するものとして、実際に記録された勝利をシェアしているのでチームのポイントを合計すると実際の勝利数と等しくなるようにできているようです(ですよね?)。
 ただ管理人は各選手を平均的な環境に置いた場合にどういう影響を与えるかを計ることが公平だと考えていまして、そのような評価を各選手について導き出して合計しても(それが神の目線で正しい算出だったとして)それらの選手が組み合わさってチームを組んだ場合の勝利数に等しくはならないはずです。
 要は実際の勝利数との一致は目指していないということで、一致していないからといって的確な評価ではないといった話になるもんでもないと思います。無論、ただ単にアジャストさせることは簡単ですがどちらかといえばチーム環境の影響は無視するように作っていますし意味はないんではないかと。

・投手評価について
 まだない。野手の評価と整合性を保ちつつということを考えるとDIPSしか思いつきません。心許ないことは確かですが、打たせたのがいくら簡単な打球だとしてもBIPを処理するのは野手だし、LOB%の部分にしてもBIPその他を野手に預けている以上攻撃時の打線の繋がりなんかと同じで誰か一人の責任にできるもんじゃないと言えて、ブレずに一貫してDIPSを使うならひとつ成り立つ考え方ではありそうです。
 出場貢献分+DIPSベースのRSAA といった式になるんですが、スターターはまだしもリリーバーの評価にはそぐわないものになりそうです。

・マイナスの値
 絶対値にしたつもりでもマイナスと出る選手がいます。どんなに劣悪なチームが試合を重ねても勝利数がマイナスになることはあり得ないですからこれは考えものだと思うのですが、指標の総和ゼロ性が確保されなくなるので安易にゼロに置き換えたりするわけにもいきません。評価法の論理性の問題でもあります。要検討。

・補足
 この「語りというかだべり」で色々書きましたがかなり自信がない内容ばかりです。その程度の扱いにしてやって下さい。正しい考え方に近づいていけるよう精進したいと思います。


トップ


ページのトップへ戻る
inserted by FC2 system