指標の分布
1.基準の必要性
 安打を打つ確率、長打を打つ確率が高い打者は得点に有効です。3割30本といえば、「普通に考えれば」かなりの強打者でしょう。
 では何故3割30本は「普通に考えれば」かなりの強打者なんでしょうか。変な問いに感じるかもしれませんが、実はここが評価の肝になる部分で、結局「普通」多くの打者はそれほどの打撃成績を収められないからです。
 みんなが4割50本打っているリーグがあるとして、そこでの3割30本は評価に値しますか。しませんよね。
 並の打者に比べてよく打っている打者がいると相対的にチームが得点力アドバンテージを得られる(ひいては他のチームに比べて勝率が上がる)から目的が達せられる。そのときその打者は評価に値するのです。実のところ3割30本という数字に単独で価値が見出せるわけではありません。
 相対的に優劣を比較するということです。
――当サイト「基本的な考え方」より

 ということで、ある選手の成績が優れているかどうかは相対的な比較により判断されるものです。
 とはいえ、じゃあ平均からどのくらい傑出したらどのくらいすごいのでしょうか? OPSの平均が.730だとして、対象の打者のOPSが.850だったら少なくとも優れていることはわかります。しかしその成績は滅多にないぐらい希少なのか、チームによくいる程度なのか。
 特定の水準の成績がどのくらいの割合で達成されるものなのか、例えば打率3割以上を残せるのは規定打席到達打者のうち何パーセントなのか、逆に2割5分を下回ってしまうのは何パーセントなのかといった分布を知ることは選手の価値を知る上で有意義です。
 日常的に指標を追っている人にとっては経験則的に染み付いていることではあるかもしれませんが、ここで一度様々な指標についての分布を整理しておきたいと思います。



2.計算の手順
 使用するデータは2006年から2008年まで、3年間のNPB公式データ。年度・リーグの異なるデータを一気に扱う上で相対的な分布を正しく把握するために、リーグ平均値による補正を行います。
 打撃の指標であれば投手の打席を除いたリーグ野手平均値を算出し、そのリーグ野手平均値で固有の成績を割ることで傑出度を出します。最後に一般的な基準となる値をかけて、度数分布表を作ります。
 例えば野手平均打率.261のとき.295の成績を残した選手を.270という基準に置き換えるならば
 {固有の打率.295/リーグ野手平均打率.261}×基準値.270=.305
 となります。
 度数分布表を作る際には便宜的に「打率.260〜.279」といった区切りを作りますが、この区切りの位置・範囲は恣意的なものであることをご了承下さい。区切りの位置を変えれば分布の表はまた違った印象になることもあり得ます。一応見やすさと結果の扱いやすさを考えた結果ざっくりとした区切りの度数分布表ということにしました。

 対象としたデータは野手は打席100以上(延べ506人)、投手は対戦打席100以上(延べ553人)です。
 なお、扱っている指標については用語解説にまとめてあるものも多いので説明と計算式はそちらをご覧下さい。



3.打者の指標
 まずは、セイバーメトリクスではあまり使わないスタッツではありますが伝統的によく使用される打率から。
 基準とした値とサンプルの中での標準偏差も載せます。

打率 基準値:.270 標準偏差:.039

.340以上1.19%
.320〜.3394.35%
.300〜.31912.06%
.280〜.29919.37%
.260〜.27922.13%
.240〜.25917.39%
.220〜.23911.66%
.200〜.2196.32%
.200未満5.53%

 最も割合の多い範囲を青太字、2番目3番目に多い範囲を青字にしています。.260以上.279以下の打者は全体のうち22.13%だった、と読んで下さい。
 平均の近くに多くのサンプルデータが集まり、平均から離れるほどに割合が減っていくという分布の形をしています。これは自然な形で、以後出てくる全ての分布はこういう形をしています。
 よく一流の目安と言われる3割以上は.270を基準とすると約18%。実際のところ達成は難しいようです。この分布は結局のところ、おそらく全ての打者が高い数値を目指している中その成績を残せる打者はそれだけしかいない、ということで、難易度のように見てもいいと思われます。少ない割合の選手は存在が希少であるというように獲得しようとするときのバリューとしても考えられるかもしれません。

 続いて出塁率。

出塁率 基準値:.330 標準偏差:.043

.410以上1.58%
.390〜.4094.74%
.370〜.3896.13%
.350〜.36913.83%
.330〜.34919.57%
.310〜.32918.18%
.290〜.30915.42%
.270〜.28910.47%
.250〜.2694.35%
.230〜.2493.56%
.230未満2.17%

 出塁率の場合、出場しているんだけれども平均を超えられないという打者も多いようです。平均以上の割合は半分よりやや少ない46%。
 3割7分以上は1/8程度ですから、セ・リーグならばスタメン野手のうち一人ぐらいしかいない、ということになります。



長打率 基準値:.400 標準偏差:.086

.600以上1.58%
.550〜.5992.17%
.500〜.5497.31%
.450〜.49910.67%
.400〜.44922.33%
.350〜.39921.94%
.300〜.34919.76%
.250〜.29910.08%
.200〜.2493.36%
.200未満0.79%

 長打率も平均を超えた選手は44%と半分未満。「出塁して足で貢献するタイプ」なども許容されるためか平均の下1割くらいの範囲に結構多くの打者が入っています。
 チームの中で長打率自慢になるために要求される水準は.500くらいでしょうか。.600を超えられる選手は極々一部。



OPS 基準値:.730 標準偏差:.120

1.000以上1.19%
.950〜.9991.78%
.900〜.9494.35%
.850〜.8994.15%
.800〜.84911.07%
.750〜.79913.24%
.700〜.74917.19%
.650〜.69915.81%
.600〜.64916.01%
.550〜.5997.91%
.500〜.5493.16%
.450〜.4992.77%
.400〜.4490.59%
.400未満0.79%

 .730を平均とおくとしても.600から.699に32%の打者が入るなどそんなに打てない打者も多いです。.700以上は53%、.800以上は23%、.900以上は7%。
 .900以上を要求するのは相当に高い水準であると言えそうです。4人に1人いるかいないかぐらいの.800以上あたりが一般的な強打者の目安としては無難でしょうか。もちろん平均を超えれば少なくとも全体の位置付けの中では「打てる」選手です。



RC27 基準値:4.5 標準偏差:1.663

8.50以上1.58%
7.50〜8.492.96%
6.50〜7.495.73%
5.50〜6.4912.06%
4.50〜5.4920.36%
3.50〜4.4926.09%
2.50〜3.4920.36%
1.50〜2.497.71%
1.5未満3.16%

 ざっくりした区切りですがまぁレンジも広いので。本質的には重要な意味を持つスタッツではあるもののこうして見るとどうしても「だから何」ってのが連想しにくいですねぇ。BRに進みます。



BR 基準値:0 標準偏差:14.667

50以上1.19%
40〜49.92.17%
30〜39.93.16%
20〜29.94.55%
10〜19.99.09%
0〜9.922.13%
-10〜-0.142.49%
-20〜-10.113.44%
-20未満1.78%

 「チームの勝ちをひとつ減らしちゃうほどじゃないけど、マイナス」という選手の多いこと。絶対値稼ぐには打席数立たなきゃならないって事情もあるのですが。マイナスが全体で57%。10点を超えるのは20%だけですからそのくらいでも十分尊敬に値します。
 50を超える打者は506人中6人でこれは3年間の延べ人数ですから単年あたりでは各リーグにひとり。つまりBR+50は打撃に限ればMVPレベルということになります。2006年の福留が68点(サンプル中最高)なんていうスコアを叩き出していますが、マイナスの選手も多い並びの中でいきなり見ると不気味ですらあります。ちなみに同年同チームのタイロン・ウッズのBRは58点。二人合わせて126点。これは、仮にそれ以外の要素が平均より少し下ぐらいのチームだとしても「福留とウッズの打撃」という要素だけでチームを優勝させてしまえるぐらいのスコアです(二人が在籍した2006年の中日は実際に優勝しています)。余談でした。

 打撃の指標として最後にBABIP。


BABIP 基準値:.300 標準偏差:.040

.400以上0.20%
.380〜.3990.40%
.360〜.3792.96%
.340〜.3597.91%
.320〜.33917.19%
.300〜.31923.91%
.280〜.29916.80%
.260〜.27913.64%
.240〜.2598.10%
.220〜.2394.35%
.200〜.2191.98%
.200未満2.57%

 運の要素が大きいと言われるBABIP。
 平均±1標準偏差の間に収まるのが72%で、1例だけ記録された4割超えも106打席でのもの。シーズン通して4割のBABIPとかは、少なくとも期待はしないほうがよさそうです。



4.投手の指標
 続いて投手の指標。もちろん全てリーグ平均値による補正を行っています。表の見方も打撃指標と同様。


防御率 基準値:3.70 標準偏差:1.39

6.70以上3.62%
6.20〜6.691.08%
5.70〜6.193.07%
5.20〜5.695.24%
4.70〜5.199.04%
4.20〜4.6911.75%
3.70〜4.1915.01%
3.20〜3.6917.90%
2.70〜3.1916.27%
2.20〜2.698.86%
1.70〜2.194.34%
1.20〜1.692.89%
0.70〜1.190.36%
0.70未満0.54%

 ほぼ平均値で上下真っ二つ。言うまでもなく低いほど好ましい数字ですが、3点台の投手が34%、2点台の投手が20%。サンプルには結構投球回の少ないリリーフ投手なんかも含まれるのですが1点台または0点台の割合となると7%とガクっと減りますから、とりあえず平均3.70の下なら合格点で2点台なら十分という感じでしょう。比較的よく触れるスタッツで違和感もないですね。



失点率 基準値:4.10 標準偏差:1.53

7.10以上4.16%
6.60〜7.092.17%
6.10〜6.593.07%
5.60〜6.095.24%
5.10〜5.598.86%
4.60〜5.0911.93%
4.10〜4.5912.66%
3.60〜4.0914.83%
3.10〜3.5916.82%
2.60〜3.0910.49%
2.10〜2.594.88%
1.60〜2.093.44%
1.10〜1.590.90%
1.10未満0.54%

 守備の失策による失点も含めた失点率のほう。なお、管理人は失策というのがそもそも記録員の主観であることや投手の責だろうがなんだろうがチームとしては「失点」の分点を取られているのでその実態を掴みやすくするために自責点より失点、防御率より失点率を好んで使います。守備と切り離すのはDIPSに頼ることにしています。
 で、失点率の分布ですが、サンプルの数にすれば大した違いじゃないのでたまたまかもしれませんが平均より下に離れたところが最頻値になってしまいました。3点台は30%、2点台は15%。全体の数字が大きいので当たり前ですが2点台などに留まるのは防御率より難しくなっています。



K/G 基準値:6.80 標準偏差:1.96

11以上1.99%
10〜10.93.80%
9〜9.97.05%
8〜8.913.02%
7〜7.915.37%
6〜6.923.33%
5〜5.917.00%
4〜4.911.57%
3〜3.95.61%
3未満1.27%

 奪三振数を対戦打席数で割って38をかけた数字。奪三振のレートを表す数字というと「奪三振×9/投球回」で求められる奪三振率(or K/9)が使われることが多いかもしれませんがなぜこのサイトではK/Gなのかというのを説明していなかったかもしれません。
 話は簡単で、A投手が投げた「安打 三振 四球 三振 本塁打 三振」というイニングとB投手が投げた「三振 三振 三振」というイニングを見たときに、「奪三振×9/投球回」ならばあくまで27アウトのうちの奪三振の割合なのでアウトが全て三振である両者の奪三振率は同じですが、より「三振を奪う力」が優れているのはB投手じゃないかということです。個人的には打者と対戦するうちどれだけを三振で切ってとるかを見たいので打席あたりの奪三振を使用しています。見やすくするために一試合平均打席数38をかけたのがK/Gです。下に出てくるBB/GもHR/Gも同じように打席あたりの与四死球と被本塁打の38倍。



BB/G 基準値:3.10 標準偏差:1.08

5.10以上5.06%
4.60〜5.095.61%
4.10〜4.597.96%
3.60〜4.0916.82%
3.10〜3.5918.26%
2.60〜3.0915.19%
2.10〜2.5918.44%
1.60〜2.098.68%
1.10〜1.593.25%
1.10未満0.72%

 ちょっと変な分布に見えますが区切り位置を変えれば「こぶ」は消えますので特に問題ありません。他の投手指標にも言えることですが先発とリリーフをごっちゃに扱っているために階層ができる可能性っていうのはあるかもしれませんし若干面白い分布には見えますが。
 38打席対戦するうち四死球を2コ未満に抑えろっていうのはかなり難しい注文のようです。逆に5以上出すような投手はほとんどいないっていうことではさすがにプロ、でしょうか。



HR/G 基準値:0.90 標準偏差:0.44

2.10以上0.72%
1.80〜2.092.71%
1.50〜1.796.33%
1.20〜1.4912.66%
0.90〜1.1925.86%
0.60〜0.8924.95%
0.30〜0.5919.89%
0.30未満6.87%

 38打席あたりの被本塁打が0.60だとか0.90だとか小さな違いに感じるかもしれませんが、本塁打を打たれるのとアウトにとるのとでは約1.7点もの得点期待値の違いがあるので被本塁打率がちょっと変わるだけで失点率への跳ね返りは結構なものです。
 通算ではなかなか誤魔化し効かないですが、投手が単年ですごい成績をあげるには「たまたま本塁打を打たれない」という助けが必要なのではないかなぁと思います。DIPSにおいても最重要であり扱いが難しい項目。



DIPS 基準値:4.10 標準偏差:0.92

7.10以上0.36%
6.60〜7.090.90%
6.10〜6.591.27%
5.60〜6.094.16%
5.10〜5.598.68%
4.60〜5.0915.55%
4.10〜4.5919.35%
3.60〜4.0922.97%
3.10〜3.5917.18%
2.60〜3.097.05%
2.10〜2.591.99%
2.10未満0.54%

 当サイトオリジナルの式(失点率スケール)を使っていますのでご注意下さい。
 運を排除するような形になるので、失点率そのものより標準偏差はずっと小さくなっています。失点率で2点未満っていうのは21サンプルあったわけですが、DIPSでは3例。守備や運の助けなしに傑出できる度合いというのは思うより限界があるのかもしれません。
 もちろん、失点率のサンプルの中の0点台や1点台が守備の悪い中達成されたものであるって可能性も十分に考えられるのですが。



BABIP 基準値:.300 標準偏差:.038

.400以上0.72%
.380〜.3991.45%
.360〜.3793.07%
.340〜.3598.68%
.320〜.33914.65%
.300〜.31921.88%
.280〜.29921.52%
.260〜.27913.56%
.240〜.2598.50%
.220〜.2394.16%
.200〜.2191.27%
.200未満0.54%
※(安打−本塁打)/(打席−本塁打−四球−死球−三振)

 DIPS以来、従来の野球観対セイバーメトリクスということに関して因縁の投手BABIP。公式記録に犠打と犠飛のデータがないため打者のとは微妙に違う式なのですがあえて基準の値を揃えてあります。
 短絡的に見れば、統計学的に「きれいな分布」になっているところが運であることを表しているようにも見えます(平均の前後.280〜.299及び.300〜.319を頂点としてかなり左右対称な山になっています)。各チームのエースなどイニング数を多く任される優秀な投手たちが優れた数字を出す傾向があるなら平均が中央値よりも下に傾くはずです。打撃指標のそれらが上に傾いているように。まぁそもそも標準偏差が理論値を超えちゃってるんでしょうけど。投手の通算成績など見たら、明らかにBABIPが信頼区間を外れている投手が「偶然」の仮定より多く出るようですしね。完全な運で片付けることは無理です。



RSAA 基準値:0 標準偏差:11.17

40以上0.54%
30〜39.91.08%
20〜29.94.16%
10〜19.911.21%
0〜9.934.90%
-10〜-0.135.80%
-20〜-10.19.76%
-30〜-20.12.35%
-30未満0.18%

 最後に実利スタッツであるRSAA。打者のBR同様、+10を超えるような数字を叩き出せば立派なものです。+30を超えたあたりでリーグトップクラスの数字ということになります。
 打撃のBRでマイナスを製造するのは打てずにすぐ打席が終わるだけのことであり、それが守備重視の捕手だったりするとある意味目立たない可能性もあるんですが、投手のRSAAで大きなマイナスを出すのは打たれている間イニングが終わるまで待っている状況が続くということで、待ちたくなくてもその投手の投球回をミニマムに抑える策を打てるほど他に投手もいないという、当人はもとより守備やベンチの人間も相当しんどい状況であったことが想像されます。余談でした。



5.終わりに
 読み物として面白い類のものではなかったですが何かのときのリファレンスとしてどうぞ。表現方法は相当簡略化したものなので細かいところはわかりにくいという問題がありますが。
 中身に関して今後に向けてということであれば、サンプルがごく最近のものでしかないのと、投手については先発とリリーフをごっちゃにあつかっているのが少し気持ち悪いので分けた統計が出せればベターかもしれないといったところでしょうか。
 まぁ言い出せばきりないので、だいたいの傾向を知っておくだけでも役に立つんじゃないか、ということで。




トップ > 四方山話 > 指標の分布

inserted by FC2 system