指標の年度間相関(2010)

1.各指標の再現性

 OPSやDIPSなどセイバーメトリクスの各種指標は、期間をまたいでも「ある期間において高い人は次の期間も高く、逆に低い人は低い」という傾向が見られるのかどうか。これを計測することは指標が選手の能力をうまく捉えているかどうかを推し量る慣例的な手法となっています。特に一般的なのは、同じ選手の連続する2年のデータをペアで集め、(対象とする年から数えて)1年目と2年目の数値の相関をとることです。
 これについては以前にも2005年から2008年までのデータを使用して既に計算を行っておりますが、今回さらに2年分データが蓄積されたということでサンプルサイズを増やして改めて計算してみました。
 ほとんど結果は変わりませんが同じ結果でもサンプルサイズが違えば信頼度が違うため、確認としてご覧いただければと思います。



2.打者の指標

 2005年から2010年までの間に2年連続して300打席以上の出場がある選手の成績2年分をペアとして集計した結果。nは322で、登録名で集計しているため同じ選手でも登録名に変更があるとデータに漏れが発生していることになりますがまぁ基本的に結果に影響はないと思われます。

指標相関係数
HR/PA.82
IsoP.80
SO/PA.72
SLG.69
BB/PA.67
OPS.63
OBP.48
AVG.30
BABIP.23

 相関係数は-1から+1までの数字で、1に近いほどふたつのデータのあいだに「片方が増えれば他方も増える」という傾向が強いことを表します。
 打者で言えば、本塁打と長打系インデックス、三振率、四球率などが強い相関を示すようです。掲載しているのは一般的な指標に絞ってありますが、例えば打席あたりRCなどはほぼOPSと同じですし、基本的なところは抑えているので性質の近いものについてはだいたい類推できるはずです。




3.投手の指標

 投手についても集計の対象は打者と同様です。以前の算出では200打席以上を対象にしていましたがサンプルも増えましたし打者と揃えるために300打席以上を対象にしました。n=227。

指標相関係数
K/PA.73
BB/PA.56
FIP.53
WHIP.35
RA.33
HR/PA.30
ERA.30
LOB%.25
W%.20
BABIP.08

 奪三振率、四死球率が再現される傾向が強いようです。LOB%は出塁させた走者を生還させない割合、W%というのは勝率で、これらはなかなかアテにすることが難しい。ボロス・マクラッケンにより有名になった投手のBABIPは、ほとんど「ある年高かった投手は翌年も高いはず」といった予測を不可能なものとしています。指標が能力を表しているかどうかということを抜きにしても、統計的な事実として一貫した傾向がないため容易には(というかBABIPに関しては実際のところ手間をかけても)予測できないのです。




4.相関係数を使った予測

 細かいことを言えば、異なる指標同士の相関係数たち(たとえば[四球率と四球率の相関]と[三振率と三振率の相関])の大きさを比べること自体には本質的な意味はないと言われます。ではこの相関係数には何の目安になり、どのような利用法があるのでしょうか。
 使用法のひとつはどれくらい再現されるかの傾向を利用してそのまま予測を行ってしまうことです。こういった場合の相関係数のデータを利用して「ある年の成績から次の年の成績を予測する」回帰式を構築する場合、その式は相関係数をr、選手が残した指標xの結果をRate(x)、指標xの平均的な数値をAvg(x)とすると、予測される次の年の数値yは実質的に次のような式で表すことができます。※1

 y = r * Rate(x) + ( 1 - r ) * Avg(x)

 つまり相関係数の分だけ前年のパフォーマンスが残るような形になり、そこに平均的な水準が「 1 - r 」の分だけ混ぜ合わせられる、結果的には加重平均のような形になります。たとえば出塁率で計算してみると、相関係数rは.48ですから以下のようになります。

 翌年の予測出塁率 = 0.48 * 出塁率 + ( 1 - 0.48 ) * 平均出塁率

 このようにしてみると、相関係数が高いほど前年の成績がそのまま翌年も再現されるというのがよくわかるのと同時に、不思議と一定の割合で「平均値」に近づけられることもわかります。出塁率の平均を.330として計算すると出塁率.370の打者は、予測では.349ほどになってしまいます。
 平均的水準の数値が混ぜ合わせられるのは、少ない試行数(この場合打席数)の場合はランダムな誤差の影響により実力以上に高く出たり低く出たりすることがあり、その影響は継続しないため別の期間を想定すると本来の実力に近い数値が出てくること、そしてまた本来の実力は基本的には平均的水準の周辺に多く分布していることによります。

 具体的なシナリオで考えてみましょう。たとえばペナントレースの開始一ヶ月のあたりで打率4割を打っている打者というのがときどきいます。しかしそういった打者はシーズン全体での規定打席に到達するような頃には必ず4割を下回り、当初より平均に近い水準に引き戻されています。これは一見良いことが起きた後にバランスを取るようにして悪いことが起きた(あるいは疲れが出たとか警戒されるようになったとか欲張ってフォームを崩したとか)ようにも見えますが、必ずしもそのような特殊な法則や因果関係によるものとは限りません。単に序盤は本来の実力に対して運が良すぎたため高く出ておりその後は普通のパフォーマンスをしただけだけれども良かったときに比べれば相対的に悪いため調整されたように見えるという面も通常多くあり、予測式にはこの性質が表れているのです。統計データにみられるこのような現象は「平均への回帰(Regression to the mean)」と呼ばれ、特にプロジェクション(選手の成績予測)の発達したMLBでは統計を理解するために極めて重要なコンセプトのひとつとして扱われています。統計的な見かけの現象である平均への回帰を現実世界の特殊な法則のように解釈してしまうと思わぬ誤りを犯す危険があります(平均への回帰は野球の統計に特有の現象ではありません)。

 この平均への回帰については野球についての統計を学ぶ上での古典である『メジャーリーグの数理科学(上)』においても言及がありますし、また一見関係がないようですが友野典男『行動経済学』の中にも人は確率的な事象の客観的な理解が苦手であるという冒頭部分の説明に平均への回帰についての簡潔で明瞭な記述があり、これはまるでセイバーメトリクスの研究者によるものであるようにさえ見えわかりやすいので少し引用してみます。
 
平均への回帰
 プロ野球の試合で、その日に一軍に昇格したばかりの新人がヒットを3本打ち、イチローが同じ日に無安打ということもありうる。この事実だけで、この新人は優秀でイチローは無能であると判断したら間違いであることはすぐわかる。長期的に見れば、新人は打率2割3分でイチローは3割以上をマークすることがありそうだ。ある1日だけではこの新人はイチローを上回る成績を残したとしても、他の日の試合ではそうはいかず実力が徐々に現れてくるのである。
 つまり短期的には打率は上下しても、大数の法則により長期的には平均値(打率)に収束するのである。この現象を「平均への回帰」という。
 平均への回帰を無視するのも、少数の法則による誤りである。1試合という小さなサンプルから実力を評価してしまう誤りである。二○○五シーズンに99敗して断トツ(?)で最下位だった楽天ゴールデンイーグルスでさえ、中日ドラゴンズに3連勝したことがある。短期のデータだけから実力を推し量るのは間違いのもとなのだ。
 プロ野球の世界では「二年目のジンクス」があり、一年目に活躍した選手には二年目には成績が落ちると言われる。この現象は事実であるとしても、その原因として、一年目は一生懸命だったのに成績が良かったら慢心して二年目は怠けるせいだとか、二年目は相手投手が警戒して厳しい球が多くなるから打てなくなるのだといったような解釈がされている。そういった要因を全く否定するのではないが、平均への回帰であると考えるのが妥当である。
 一年目に良い成績をあげた選手は二年目には成績が落ちるのが、逆に一年目に成績が悪かった選手は二年目には成績が上がるのがふつうなのである。二年目に一年目の好成績を維持したり、さらに上がる選手は、それだけの高い実力を持っているのだ。ただこの場合には二年目のジンクスとは無縁だと言われるのである。※2

 そういうわけで平均への回帰には注意してデータを扱いましょう。なお、成績を予測する際の相関係数はここで取り上げた範囲の試行数(打席数や投球回数)を対象にする限りにおいて有効なものであることにご注意下さい。もっと打席数の多い選手に対しては理屈上相関係数が高くなるし、逆もまた然りです。つまりこのページに記載されている係数は万能ではありません。





※1 計算上、相関係数から回帰の傾きと切片を計算するときに説明変数と目的変数の平均及び標準偏差が実質的に等しいものとして扱えることによります。必ずしも厳密に数字がそうなるわけではありません。

※2 友野典男 『行動経済学』、光文社、2006、78-80頁





トップ > 四方山話 > 指標の年度間相関(2010)

inserted by FC2 system