WHIPの解釈と応用

1.はじめに

 投手を評価する指標にWHIPというやつがあります。今回は、このWHIPについて書いてみようかと。
 いきなりでなんですが私はこれまでほとんどWHIPを相手にしたことがありませんでした。別に、そういう指標があることはよく知っていましたし自分のエクセル上で計算したことも何度もありますが、セイバーメトリクスの分野で生まれた様々な指標のうちで、特に有用なものだとは思っていません。
 しかし、それがいいか悪いかはともかく、WHIPは式が簡潔で、数少ない「わりと露出のあるセイバーメトリクスの指標」のひとつのようです。MLBでは公的な記録ですし、ファンタジーベースボールというゲームでも採用されているようです。日本でも、セイバーメトリクスを紹介する記事なんかでは結構な頻度で登場しているように思います。
 となれば、WHIPというのがそもそもどんなものか、どんなことに有用で、あるいはどんな応用が考えられるかという引き出しを頭の中に持っておくことは有意義かと思われます。
 そういうわけで本稿ではWHIPについての解釈と応用を書いていきたいと思います。ただし一般的にどう使われているかなどにこれといって配慮する気もなく好き勝手にこねくり回す記事ですが、悪しからず。




2.WHIPとは何か

 WHIPとはWalks plus Hits per Inning Pitchedの略で、式は以下。

 WHIP=(被安打+与四球)÷投球回

 親切なことに式がそのまま名前になっています。意味としてもそのままで、イニングあたりにどれだけヒットを打たれて四球を出したか、すなわち「頻繁に出塁されているかどうか」です。投手にとっては出塁を許す数は少ないほうが好ましいわけですから、WHIPの数字も低いほうがいいということになります。
 ここで式を少しだけちゃんと確認すると、根本的には「出塁とアウトの比」の形をしていることがわかります。同じように出塁とアウトを評価する式には打者の出塁率があって、こちらは公式記録となっていますが、WHIPと出塁率は違うのでしょうか。
 打席の結果は打者が出塁するかアウトになるかのどちらかです。実はこの両者のバランスを評価するのに、全体のうちの割合で評価するのが出塁率です。

 出塁率=出塁÷(出塁+アウト)

 そして割合ではなく両者の比にしたのが上記の通りWHIPですが、これは分子の出塁を分母のほうにも入れてあるかどうかの違いだけです。平均的なWHIPを1.35とすれば、1イニングは3アウトですから分子を分母に足してやれば

 出塁の割合=1.35÷(1.35+3)=0.310

 と計算でき、出塁率とほぼ同じ意味の指標となります。従って、仮にWHIPに馴染みがなくても実質は投手版の出塁率で表現の形が違うだけだと思っておいて問題はありません。
 出塁率の平均である.330に比べてやや低いのは出塁に死球を含めない一方で犠打はアウトに含まれること、その他併殺打や盗塁刺などベース上のアウトも分母に含まれることによります。しかしそれらは本質的な意味を変えてしまうような違いではありません。基本的にWHIPは「イニングあたりにどれだけ走者を出したか」の指標です(ちなみに、死球が含まれていないことに特に深い意味はないと思われるので好みによって加減すればいいでしょう)。




3.有用性と欠点

 さて、そもそもどうして(すごく大雑把に言えば)どれだけ打たれたかの指標が改めて必要なのでしょうか。もちろん投手の仕事は相手に点を取らせないことですからそのことの評価は必要です。しかしそれには既に防御率という極めてよく浸透した指標があります。
 打者を評価するときの打率や出塁率と違い、防御率は直接的にその投手が登板している間に奪われた失点を表していますから、ある面では投手の実績の指標としては既に完成されているとも言えます。これが例えばDIPSであれば、防御率は野手も関わった結果だから分離させる必要があるんだとはじめからその「新たな指標として出てくる意味」はわかります。一方でWHIPは別に投手だけの能力を測るように工夫されているわけでもありません。

 この問いに対する私なりの答えとしては主にふたつ。
 まずひとつは、被生還率の問題。出塁した走者がどれくらいの割合で生還するかというのは、四球と本塁打がどういう順番で並ぶか、安打がイニング間でばらけるかばらけないかなどによります。
 出塁させた走者を生還させない割合を表すLOB%といった指標がありますが、これは非常に再現性が低い指標のひとつ。つまり、仮に「防御率が良い投手」を見つけても「防御率が良い投手」には「全然ランナーを出さず安定感抜群で防御率が良い投手」と「いつも走者を背負っていてヒヤヒヤだったけど結果的には抑えて防御率が良い投手」の2パターンが考えられますが、後者の結果は継続が期待できないということです。それならば、「どれだけ打たれたか」を直接評価してしまったほうが能力の指標としてはアテになります。
 確かに「走者を出しても上手く抑えるピッチング」のようなものも、技術としてその存在が皆無であると考えるのは不自然です。しかしここぞというときに抑える技巧のようなものを取得した投手がいたとすれば、その投手はその力を出塁させる以前にも発揮できるように努める(べき)でしょうし、結局投手の力量は「出塁させるけど還さないかどうか」よりも「打たれるか打たれないか」に表れると考える方が自然であるように思います。気まぐれな被生還率に左右された結果としての防御率に対して、単純に打席の結果の集積を見るWHIP、というように位置づければその有用性が見えてきます。
 もうひとつは、防御率という「ルール」の恣意性の問題。先発投手が残して降板した走者を後続の救援投手が生還させてしまっても、救援投手の防御率は悪化しません。しかし、普通チームが救援投手に期待するのは、その走者を還さないことです。となれば、打たれても抑えても変わらない防御率よりもWHIPで「どれだけ打たれたか」を直接見るほうが、評価としてはわかりやすいでしょう。これらふたつは特に、登板イニングのサンプルが少なく被生還率が平均化されない上に引き継ぎに左右される割合の大きい救援投手を評価する際に有効です。
 結局、防御率に加えてあえてWHIPを持ち込む意義としては「気まぐれな被生還率や走者の引き継ぎの問題に左右されずにわかりやすく『どれだけ打たれたか』を評価できる」というところです。

 当然欠点もあります。何よりも、被出塁数だけに注目する分にはいいですがどれだけ打たれたかを具体的に見るには出塁の内容を全く区別していない点は弱点です。極端に言えばイニングに四球を3つ出しても本塁打を3本打たれても同じ評価になるわけですから。この意味ではERCのほうが確実に優秀です。単打・二塁打・三塁の区別についてはデータが得られませんから無理ですが、四球と本塁打とそれ以外は区別した上で得点を推定しているためWHIPよりも緻密でわかりやすい評価となっています。
 ただしWHIPの側からすると「まぁ計算が簡単だから」という反論と、実は、それでも得点の説明力が意外に高いという特徴も持ち合わせています。詳しい数字は多少後述しますが、WHIPが失点を説明する力は出塁率が攻撃の得点を説明する力に比べてやや強いと考えられるのです。
 その理由は、出塁に比してどれだけ長打があるかという傾向(例えば出塁のうちの本塁打の割合)のばらつきは、選手ごとで見てもチームごとで見ても打者(打線)よりも投手のほうが小さいことがひとつ。これが何を意味するかというと、出塁と進塁という得点を説明する二大要素に関して、投手ごとの比較では進塁で差がつきにくいので自動的に出塁で失点が決定される割合が大きくなるということです。それ自体の理由はともかく、結果として失点の評価における出塁の比重が大きくなることは論理的にわかります(国語の試験と算数の試験の総合得点でランクが決まるようなときに、国語の試験で差がつきにくければ算数の出来にかかってくる、というような話です)。
 そして出塁率が打席のみを対象にしているのに比べてWHIPではアウトにベース上のアウトも含まれるというのがもうひとつ。併殺打や盗塁刺などで出塁の毀損があればそれは評価に組み入れられ、出塁率に比べて総合的でシビアな評価となります。以上のような理由でWHIPが失点阻止能力に結びつく度合いというのは、簡単な式のわりに意外と高いのです。
 これらの点を先程の説明に付け加えるとするならば「WHIPは気まぐれな被生還率や走者の引き継ぎの問題に左右されずにわかりやすく『どれだけ打たれたか』を評価できる。出塁の内容を区別しないという欠点はあるが投手は比較的出塁の内容によって差がつきにくいためWHIPでも失点を阻止する能力をなかなかよく説明できる」なんてところでしょうか。

 というわけで、WHIPとは何か、何に役に立つかということはとりあえず論じることができたかと思います。
 ただし、冷静に見ると以上のことからWHIPの有用性を強く主張することは難しいように思われます。
 投手はBABIPのコントロールにわずかな影響しか持てないことはわかっていますから、被安打を含める評価は投手のスキルを適切に表さない可能性が高い。かといって結果的な実績を直接に表すかといえばそうではなく、それには防御率・失点率があります。仮に打席の結果から評価をするにしてもERCのほうが正確です(そもそも、マクロ的には「防御率とよく相関している」ことほど馬鹿らしいことはありません)。
 結局、残念ながらWHIPは、DIPSなどがある今となってはわざわざ指標として持ち出すにはそれほど役に立たないと言えてしまいます。単にWHIPのランキングを眺めて「ふむふむ、○○投手はWHIPが低くてさすがだ」といって評価をするのは、乱暴に言えばあまり意味がない。※1 それは直接の実績でもなければ、ノイズを交えずにスキルを表す度合いも高くないのですから。
 ここからは「基本的には使わなくていいと思う」ということを申し上げた上で、仮に使うとすればこんな応用が考えられるだろうという筋で話を進めたいと思います。




4.応用編:WHIPERA

 個人的によく指標に求めることは、できれば得点など実利的な単位で表されていて欲しいということです。例えばWikipediaでWHIPの項目を見ると「一般に先発投手であれば1.00未満なら球界を代表するエースとされ、1.20未満ならエース級、逆に1.40を上回ると問題であると言われる」※2 という説明が書いてあります。この基準の適切さはともかくとして、WHIP 1.22と1.16だったら何がどのくらい違うのだろうか、ということがわかりにくいと思われないでしょうか。
 あるいはWHIPは「防御率は良いけどよく出塁されているから危険な投手だ」といったことを示すのに有用だと前述しました。しかし、どのくらいの防御率に対してどのくらいのWHIPであれば妥当なのでしょうか。結局、WHIPは計算式が簡単だと言っても実は数字から意味を読み取るのは難しい指標なのです。
 このことを解決するための端的な結論は、得点に換算すればいいということ。被打撃成績を防御率にする指標としてはERCが既にありますが計算がなかなか煩雑ですから、ここではWHIPのシンプルさを活かしつつLWTSの原理を用いて防御率に換算することを考えてみます。つまりWHIPERA(WHIP防御率換算値)を作ろうというわけです。

 WHIPを基準とする限りは「イニングあたりの被出塁」という軸でしか評価が行えません。従ってまずイニングあたりに被出塁が1増加することがどれだけの失点に繋がるかを計算してみます。例えばBsRを使って試算してみると、標準的な打線に平均的な割合で単打・二塁打・三塁打・本塁打・四球を含む出塁をひとつ加えると得点は0.55増加するという結果が得られました。このことから、WHIPの1単位は得点換算で0.55点であることがわかります。平均的なWHIPよりも1高ければイニングあたりの失点が0.55増えるということです。これを防御率や失点率と同じように9イニングに換算すれば

 WHIPERA=9×0.55×(WHIP−リーグ平均WHIP)

 という式により9イニングあたりで平均的な投手に比べて失点を何点少なくするか、ということがわかります。防御率スケールに直すには最後に平均的な防御率(ここでは3.80とします)を足してやる必要があります。そしてリーグ平均WHIPもだいたい固定的なものだと考えて1.35程度とおくと

 WHIPERA=9×0.55×(WHIP−1.35)+3.8

 求めるべき数字は対象選手のWHIPだけ、という形になりました。数式を整えれば以下のようにまとまります。

 WHIPERA=4.95×WHIP−2.8825
 簡単にすれば WHIPERA=5×WHIP−3

 やや雑な感じがしてしまいますが、出てくる数字を5と3にまとめてしまっても特に問題はありません。これならシンプルで、エクセルなど表計算ソフトがあれば特に苦も無く算出できると思うのですがいかがでしょうか。
 この式をNPB公式サイトで確認可能な2005〜2009年のチーム投手成績にあてはめて実際の防御率を予測すると、二乗平均平方根誤差は0.229となかなか良い結果を出します(相関係数は.893)。同じ時期のチーム打撃成績では、出塁率で得点率を予測すると二乗平均平方根誤差が0.266になることを考えてもものさしとしては悪くないでしょう。スケールの小さい防御率に合わせるほうが当然誤差もやや小さくなりがちなのですが失点率のスケールに変換しても打撃の場合に比べて誤差が小さいのは同じです(途中の式で3.8と足すところを4.2にしておけば失点率スケールの数字が出てきます)。

 このように数字を得点の単位に換算すれば、WHIPそのままの段階でよくわからなかったことが少しはわかりやすくなります。例えば防御率が3.50なのにWHIPERAが4.00だったら、その投手は防御率では過大評価になっているかもしれないということがすぐに判断できます。あるいは、式によればWHIP 1.22と1.16は防御率換算では3.10と2.80の差だということがわかります。




5.応用編:LWA

 ここまでくると、もうひと手間かけてみたいと欲が出てきます(私だけでしょうか?)。つまり、せっかく防御率に変換するのであれば、ひとまとめに扱っている出塁をせめて区別できる部分は区別してみようじゃないかということです。
 投手成績では、一般的に、与四死球・被安打・被本塁打は分けて手に入ります。四球は出塁一般の0.6倍、本塁打は2.6倍くらい価値がありますから、WHIPを計算するときにそのように加重してやればWHIPよりも現実に即した「打たれ度」の指標になります。

 WHIP改=(0.6×(与四球+与死球)+被安打+1.6×被本塁打)÷投球回

 本塁打の係数が1.6なのは、本塁打が安打のほうでもカウントされていて合計すると2.6になるからです。
 あとはこれをWHIPのときと同じように防御率に換算するだけですが、WWHIP(Weighted WHIP)とかだんだんやってやれませんし元の指標自体変えてしまっているので、打たれた側のLinear WeightsということでLWA(Linear Weights Allowed)とでもしておきましょう。

 LWA=5×{(0.6×(与四球+与死球)+被安打+1.6×被本塁打)÷投球回}−3

 LWAで失点率を予測すると二乗平均平方根誤差は0.175、相関係数.954。これは打撃でのOPS並みの精度です。比較的計算の煩雑なERCと比べてもほぼ同等の精度。※3
 もっと言えば、これは勝率の形にも変換することができます。プラス1点はプラス0.1勝の価値があるというのが一般的な法則ですから、得点価値を0.1倍して平均との差をとり、平均的な勝率.500を加算すれば相手側の勝率になります。1からその値を引けば、投手チーム側の勝率です。

 勝率評価=1−{9×0.55×0.1×(WHIP改−リーグ平均WHIP改)+0.5}
 WHIP改の平均を1.38として  勝率評価=1.18−0.495×WHIP改

 ちょっとややこしい話になるのですが、基本的には防御率の良い投手ほど被出塁ひとつあたりの得点価値は低くなります。打たれたからといって走者を溜めていないことが多いしその後打たれる心配も少ないからです。しかし一方で、全体の得点が減るために勝利に対する「1点の持つ重み」は増してきます。
 LWAによる勝率評価は、そのようなふたつの要素のどちらも考慮しておりません(ERCは前者だけ考慮します)。結果として、ふたつの誤差が相殺されるという狂った形で得点評価の場合よりも勝率換算のほうが理論的にはやや正確になると考えられます。気にするほどではない効果だとは思われますが。
 例えばこのようにして算出した勝率に「投球回÷9」の数字を試合区切りとして掛けて理論上の勝利数を出すだとか、リプレイスメント・レベルの勝率と比較してどれだけ勝ったかを計るとか、このような汎用な単位の土俵に乗っかってしまえばあとはどうとでも応用が効きます。




6.おわりに

 WHIPは比較的古いスタッツであり、現在はあまり分析的に有用なものだとはみなされていません。それでも「ネタ」にして噛み砕いてみることによって、スタッツを味わうことを試みました。
 正直に言えば、終盤のこねくり回された式に魅力を感じる人は限られているだろうと思います。WHIPがそれなりに取り上げられる理由には、ひとつにその式が単純であることが大きな要因としてあるでしょうから。
 しかし、中盤でも書いたように、式が簡単であることとその指標の意味がわかりやすいこととは全く別の話です。丁寧に調整された指標のほうがむしろ無駄が除去されて最終的な意味はすっきりしているものですし、バイアスを除去する多くの手続きを経ている指標からすれば、そうでない指標は「わざわざバイアスを加算している指標」と言うこともできます。実際の運用上手続きが多いからといって必ずしも現実と乖離しているわけではありません。このあたりの考え方はセイバーメトリクスの普及と微妙に関係しているように思われます。
 指標には必ず発案者の「野球を見る視点」が表れています。指標を分解することでそれを解釈したり、他の形に置き換えることでその他の考え方との違いを探ったりすることは、何が野球を測るものさしとして良いだろうかということを考える、ひいては野球そのものを考える機会になります。従って、数式自体というよりもそのあたりの面白味を多少でも感じていただければ幸いと思っていたりします(これは、他人に言われて面白いと感じるものではないのかもしれませんが)。





※1 WHIPが分析的に有用でない、というのはMLBのセイバーメトリシャンの間でも多くある意見のようです。例えばSabermetrics LibraryのWHIP解説は「ファンタジーベースボールをプレーしているのでもない限り、選手評価にWHIPは用いるな。…中略…留意すべき点:使わないこと。単に、使うな。それはあなたが思っているほどいいものではない」と、かなりスッパリ割り切っています。そしてFanGraphsの投稿「Strategy Session ? Don’t Get WHIPped」の一言目は「WHIPはばかげたものである」。WHIPはいわば打率のように古く簡単なスタッツだというだけのことなので本来こんな言われ方をする筋合いもないとは思うのですが、一部には主流のセイバーメトリクス系指標と同列に扱ってしまう動きがあるためこのような口調が入ってしまうようです。問題は使い方でしょう。

※2 WHIP (野球)―Wikipedia(2010年5月31日閲覧)
 近年のNPBでは、WHIPの平均は1.35程度。一定のイニングを投げた投手に限って見ると、WHIPの優秀な順に並べたときに1.15を切るあたりまでで上位1/4が収まり、逆に1.40以上になると下位の1/4が収まる範囲となります。1.40は下位グループになることは確かですが、防御率換算で4.00とさほど悪くはないはずですから「1.40以上は問題あり」という基準は結構辛めであると意識しておいたほうがいいかもしれません。主力級投手の4人に1人は問題ありと判断されるのが普通ということになります。

※3 打撃の指標と同じ基準に乗せるためにチームの成績を使用して誤差を計測しましたが、個人に当てはめることを考える場合、打者よりも投手のほうが試合を支配しており個々の得点環境の変化が激しいために本来はRCのような積算モデルを用いるべきです。Linear Weightsではいつでもイベントに一定の価値を見込みますが、それは理論的には正しくありません(ただしRCなら厳密に正しいと言えるわけでもなく規模としては小さい問題なのですが)。これについては「打撃総合指標について」あたりに関連した内容を書いています。




トップ > 四方山話 > WHIPの解釈と応用

inserted by FC2 system