指標の年度間相関
 ブログに載せたネタの焼き直し。
 色々な指標について、例えば打率ならばある打者のある年の打率と翌年の打率というものを対象にとり、相関係数(PEARSON)を計算してみたものです。
 2005年から2008年のNPBのデータを利用し、打者については2年連続して300打席を超える選手(210サンプル)、投手については連続して200打席を超える選手(224サンプル)を抜き出して調べました。
 年度ごとの平均値を考慮した補正のようなものはしていませんし粗いものではありますが。


 まずは打撃の指標。

指標相関係数標準偏差
HR/AB.808.014
SecA.766.059
SO/AB.720.040
SLG.698.064
BB/PA'.676.024
OPS.652.089
HBP/PA'.618.006
RC27.6161.374
RC/PA.612.028
OBP.531.033
BA.350.031
BABIP.289.036

 相関係数は0に近いほど相関が薄く、1に近いほど強いという意。
 あくまで300打席以上の結果だけが対象となっていることにご注意下さい。PA'は「打数+四死球+犠飛」。
 まず、最も相関の高いのが打数あたりの本塁打となっています。これは、ある年打数当たりの本塁打率が高かったものは前年も高く、また翌年も高いという繋がりが強いことを意味しています。本塁打王争いなどは結構決まった面々が名を連ねる印象もあり、納得しやすいところです。
 標準偏差は翌年との平均的な差の絶対値で、打率ならば3分くらい落ちたり上がったりして普通ということになります。
 ここからわかるのはブレがこのくらいですよということだけ。これが何に起因しているのかは解釈次第です。
 ただしどうしても触れなければならないのがBABIP(本塁打を除くインプレー打球が安打になる確率)で、これは本塁打を打つ能力、三振しない能力、四球を選ぶ能力……といったものに比べて非常に不安定という結果になっています。ある年BABIPが高かったとして、翌年どうなるかはわかりません。バットコントロールで上手く外野の前に落とすだとか、内野の間をしぶとく抜いていくといった能力が打者ごとにはっきり存在すればこうはならないはずです。少ない打数での高BABIPに依存した高打率などはたまたまである可能性も高くかなり危険かもしれません。しかし一部の打者ではっきりした傾向が見られ多少の相関があるのも事実。

 BABIPから打率に目を移すと案外似たような感じであることにも気付きます。得点への結びつきが疑問視される打率ですが、能力への結びつきも疑問視されることになるのでしょうか。
 ここで唐突に簡単なモデルを作りコンピュータシミュレーションを行ってみます。
 平均的な打者である太郎君は打率.260の実力を持ち、打席では好不調といったものはなく常に26%の確率でヒットを打つと設定します。
 この太朗君に500打数立たせるというシーズンを300回行い記録しました。
 すると、全体の平均は当然打率.260でしたが、最高で.326(下手をすれば首位打者?)、最低で.204というシーズンもありました。それは極端にしても、.240〜.280という通常収まりそうな範囲に落ち着いたのは300シーズンのうち65%程度。3シーズンに一度くらいはもっと実力から離れた結果を出していることになります。これは完全に運オンリーの偏りで、シーズンレベルの打数の信頼度というものが多少推し計れます。
 だから何だというと、シーズン打率というのは色んな意味でさほど細かい違いに注目するような指標ではないのではないかということです。実際の野球で運ばかりで結果が決まっているわけはありませんが、打席数からして運の介入を免れないのは積極的に意識されるべきと思います。
 もしかすると我々が(あるいは打者本人も含め)結果から判断する「不調」というのは、本当は不調ではないのかもしれません。※1

 ちょっと逸れました。傾向をまとめると打者の能力について時間軸で区切っても繋がりが強いのは
 1.長打(本塁打)力 2.三振しない能力 3.四球を選ぶ能力
 とまとめられそうです。OPSと打率の比較で言えば、OPSのほうが得点に結びついているだけでなく選手ごとの能力の違いもよく反映しているらしいことが言えます。






 続いて投手の指標。表の見方は同じです。

指標相関係数標準偏差
K/G.6991.460
DIPS.512.779
BB/G.509.841
HR/G.376.395
被出塁率’.352.040
被打率’.325.036
WHIP.308.238
HBP/G.300.250
RA.2901.441
ERC.2751.421
ERA.2741.341
HldR.235.070
LOB%.215.075
DER.112.041

※K/G,BB/G,HBP/G,HR/G=それぞれの打席あたりの割合×38
※被出塁率’=(安打+四死球)/対戦打席
※被打率’=安打/(対戦打席−四死球)


 こちらはまとめから入ると、相関の強いものは
 1.奪三振能力 2.与四球能力 3.被本塁打能力
 となっています。相関係数をそのまま比較するのも危険ですが、全体に打者より年度ごとの結果が不安定である様子も出ています。特に投手にとって登板の成果がダイレクトに出る防御率(ERA)は打者で最も相関が低かったBABIP以下。
 投手力を充実させることが安定した常勝チームを作る秘訣とでも言っているような言説も結構あるような気がすることを思うと意外な数字とも言えるのかもしれません。ある年防御率2.00だった投手が翌年3.34に落ち込むようなことがわりと日常茶飯事だと示されています。

 DERというのはBABIPと同じものだと思ってもらっていいのですが(“ヒットになった割合”が“ヒットにならなかった割合”にひっくり返っただけ)、投手に関してはもうほとんど相関がないものとなっています。これはこれでいきすぎじゃあないかと自分で疑ってしまうのですが。
 「打たせて取る能力」が投手ごとに存在し、それがインプレー打球を上手くアウトにしやすいようにばかり飛ばすことを指しているなら、これは矛盾です。
 そしてLOB%は出塁した走者を残塁させた割合を示しているんですが、これも非常に低い相関。「走者を出しても帰さない粘り強いピッチング」もだいぶ語られた形跡がありますが、継続してそのようなパフォーマンスを発揮し続けた例は少ないようです。
 はっきり言うとBABIP及びLOB%は偶然が多くを支配しているものなのかもしれません。能力が存在するとしても年度ごとに激しく変化するものだとしたらアテにならないという意味で偶然と変わらないとも言えます。
 安定しているのはBABIPとLOB%を除去した投手評価であるDIPS。ただこれも結局現実のERAに反映されないのなら意味がないではないかというジレンマもあります。
 諸々を踏まえると投手よりも打者のほうが期待に対する活躍は堅いと言えそうで、「打線は水物だから投手を頼りに」とはおちおち言っていられないということが感じられます。
 これらはまぁ先達の研究通りです。




※1 ここの一連の考察の仕方は『メジャーリーグの数理科学』をあえて意識してのものというか、自分なりにやり直しただけの引用みたいなものです。別に自分が考えたみたいに書きたいのではないということを一応。また同書では成績の気まぐれについての考察を深く行っておりますので興味のある方は是非。




トップ > 四方山話 > 指標の年度間相関

inserted by FC2 system