2011年度成績予測

2011.3.26

by Baseball Concrete

目次

  1. 成績予測とは
  2. 成績予測の基本的な考え方
  3. 打者の成績予測算出方法
  4. 投手の成績予測算出方法
  5. 年齢による影響
  6. 予測の精度
  7. 2011年度成績予測 打者 投手

 

1.成績予測とは

 統計で未来を予測する。これは魅力的なテーマです。我々の生活にとって重要な地震の予測やあるいは天気予報などと比べても非常に瑣末な問題ではありますが、本稿ではプロ野球選手の未来の成績を統計を使って予測するということをやってみたいと思います。

 この分野はファンタジーベースボール(仮想の自分のチームを作り、実際の選手の成績をポイント化して競うゲーム)が親しまれているMLBにおいて非常に活発であり、「Projection(予測)」とか「Forecasting(予測、予報)」とか呼ばれてセイバーメトリクスにおける大きな分野のひとつになっています。むしろセイバーメトリクスを扱った書籍のレビューに「ファンタジーの役に立たなかった」なんていう苦情が来ているのを見たことがありますから、向こうではセイバーメトリクスをファンタジーベースボールに勝つためのものと考えている人すらいるのかもしれません。

 日本プロ野球に対してはそれほど大々的に取り扱われてきた形跡はありませんし、私も以前はさほど興味がありませんでした。しかしこれまであまり行なわれていないならかえってやってみたら面白いのでは、と思ったためにわか仕込みながら挑戦してみる次第です。

 

2.成績予測の基本的な考え方

 統計データを使って将来を予測するためにどのような考えが重要なのか。おさえておくべき基本的な考え方には以下のようなものがあります。

 

  1. 選手の将来の成績は過去の成績と一定の関連がある
  2. 選手の成績においては広く「平均への回帰」が生じる
  3. 選手の成績は年齢に伴って変化するものでありその変化の仕方には傾向がある
  4. 平均への回帰および年齢による影響はプレーの側面ごとに異なる

 「平均への回帰」が地味に曲者なことを除けば、どれも非常に単純です。要するに、過去に連続して首位打者を取っている打者とずっと打率が2割台の前半で守備を買われて起用されている選手とでは前者のほうが今後も高い打率を残すことが期待できるだろうということを言っているのが1です。

 2の「平均への回帰」は、極端な成績は次の観測では相対的に平均値に寄るという統計データの特性のことです。これは観測される成績には選手の本当の能力以外に偶然の要素が働いているためで、野球のデータに限らずあらゆる観測データについてまわるものです。

 3も特に説明は不要でしょう。一般に、年を重ねるにつれてどうしても脚力やパワーといったものが落ちてきて、それが成績に変化を与えます。この変化にはある程度のパターンのようなものがあると考えられます。

 4は2および3の補足というか応用の考えで、年齢を重ねるにしてもプレーにおけるすべての側面に関して同じように衰えていくわけではありませんし(筋力の衰えに比べて、選球眼などは衰えにくいでしょう)、プレーの中には能力が順当に反映されやすいものとそうではないものがあります。例えば投手は、継続して三振を奪うことはできてもインプレー安打を防ぐことは難しいらしいということがデータからわかっています。

 

 以上の4点はほとんど説明が不要なほど単純です。しかしここでは、そのたった4点だけを考慮して成績予測システムを構築してみたいと思います。

 その理由は、私は成績予測に関してあまり詳しくはないためまずは基本的なことに的を絞って行ないたいというのがひとつ。そして、おそらくは基本をしっかりおさえることができれば必要以上に手間をかけて複雑にしなくても有効なシステムが作れるのではないかと考えるのがもうひとつです。

 広い意味で言えば、統計で予測をするというのは要するに法則を見つけてそれを個別の事例に適用するということです。ここでいう法則とは、キャリアを通じて選手の成績にはある程度の一貫性があるということだとか、年齢の変化に応じて成績が変化することです。どのような法則が働いているのかを見定め、その定量的な影響を明らかにすることができれば、成績予測は機能するものになるでしょう。

 今回はさまざまな検討を重ねて作成したというものではなく、むしろ頭の中だけでロジックを組み立ててそれをそのままシンプルに数字に落としました。基本的なロジックで組み立てた予測がどれだけ機能するかの確認というふうに見ていただければと思います。

 

3.打者の成績予測算出方法

 考え方が単純とはいえ計算すべき項目は多数ありますので、係数の由来などの説明は簡単に留めておきたいと思います。

 まず、打者の成績予測計算方法を示します。

 

 (1)打席数の見積もりを立てる

 これも本来「予測」するべきなのでしょうが、出場機会というのは人為的な問題が大きいためにあえて他の予測とは分けておきたいと思います。例えば過去3年ずっとレギュラー出場している選手でも、同じポジションにFAでリーグを代表する選手が移籍した場合には出場機会が大きく減ることになるでしょう。また故障があって単純に出場の見通しが立たないということもあります。このような外部環境の変化はいちいち教えてやらないとデータにはわかりません。結局、データだけから予測するよりも政治的な関係を見ながら主観的に予想するほうが合理的なのではないかと思われます。あえてデータだけから予測をするならば、たとえばプロジェクションを行なう時点で最新の年度を「今年」として「0.5×今年の打席数+0.3×1年前の打席数+0.2×2年前の打席数」といったふうに最近の成績に適当な重みをつけて加重平均するといったことが考えられます。ここで予測した打席数をpPAとします。

 

 (2)成績の信頼性を計算する

 予測を行なうにあたって過去の成績を参考にするわけですが、過去の成績をどれだけ真に受けていいかというのはサンプルサイズに依存する問題です。つまり、多くの打席数出場している選手であればランダムな誤差はかなり平均化されているため仮にOPSが高ければそのまま今後もOPSが高いだろうと考えていいでしょう。しかし打席数が少なければそうはいかなくなります。このことを選手ごと・項目ごとに計算する必要があります。

 なおこのシステムで打者の成績の予測のために計算する指標は打席あたりの四死球・三振・本塁打、そしてBIPあたりの単打・二塁打・三塁打の割合です。

 また犠飛は打数にカウントする考え方をとっており、犠打と打撃妨害は打席数に含めないものとして処理しています。そして利用するのは過去3年間の成績であり、この信頼性の計算では過去3年間の成績の単純な合計を使用します。出てくる指標ごとの定数はyear-to-year correlationの研究によります。ちなみにこれが「平均への回帰」を考慮した成績の調整となります。

 

 rBB%=(AB+BB+HBP+SF)/((AB+BB+HBP+SF)+250)

 rSO%=(AB+BB+HBP+SF)/((AB+BB+HBP+SF)+190)

 rHR%=(AB+BB+HBP+SF)/((AB+BB+HBP+SF)+110)

 r1B%=(AB-HR-SO+SF)/((AB-HR-SO+SF)+700)

 r2B%=(AB-HR-SO+SF)/((AB-HR-SO+SF)+520)

 r3B%=(AB-HR-SO+SF)/((AB-HR-SO+SF)+380)

 

 例えば2010年500打席、2009年450打席、2008年300打席の出場がある選手を仮定した場合、その選手の2011年の成績を予測する上での四死球率の信頼性は (500+450+300)/((500+450+300)+250)=0.83 になります。

 

 (3)過去の成績を加重して統合し、各指標の計算をする

 選手の将来の成績は過去の成績と関連しています。ここでは計算の現実性も考え、考慮するのは過去3年までです。年齢や技術の進歩のことを考えると過去の成績の中でも新しいもののほうが将来を予測する上でより重要と思われるのですが、データで傾向を見るとそこまで大きな重要性の違いはないように思われます。

 しかしやはり古い成績は重要性がやや劣るようですから新しい年から4/3/2の比率で重みを与えます。つまり2011年の成績を予測したいのであれば2010年の成績(打数や安打数など)を4倍、2009年の成績を3倍、2008年の成績を2倍して合計をとり、以下の各指標を計算します。

 

 BB%=(BB+HBP)/(AB+BB+HBP+SF)

 SO%=SO/(AB+BB+HBP+SF)

 HR%=HR/(AB+BB+HBP+SF)

 1B%=(H-2B-3B-HR)/(AB-HR-SO+SF)

 2B%=2B/(AB-HR-SO+SF)

 3B%=3B/(AB-HR-SO+SF)

 

 (4)指標の予測値を計算する

 加重された成績からの指標とそれぞれの信頼性に基づいて、指標の予測値を計算します。なおlg○○はそれぞれの指標のリーグ平均値を表します。またここで年齢の要素を織り込むこととし、予測値全体に係数を掛けます。f(x)で表されているのが各指標に適用される係数で、対象の選手の年齢で一般的に各指標が何倍になるかを表します(具体的な数値については後述します)。

 

 pBB%=f(BB)*(rBB%*BB%+(1-rBB%)*lgBB%)

 pSO%=f(SO)*(rSO%*SO%+(1-rSO%)*lgSO%)

 pHR%=f(HR)*(rHR%*HR%+(1-rHR%)*lgHR%)

 p1B%=f(1B)*(r1B%*1B%+(1-r1B%)*lg1B%)

 p2B%=f(2B)*(r2B%*2B%+(1-r2B%)*lg2B%)

 p3B%=f(3B)*(r3B%*3B%+(1-r3B%)*lg3B%)

 

 (5)各種予測値を計算する

 計算された指標に予測される打席数を掛けて、最終的な成績を計算します。

 

 pBB=pBB%*pPA

 pSO=pSO%*pPA

 pHR=pHR%*pPA

 p1B=p1B%*(pPA-pBB-pSO-pHR)

 p2B=p2B%*(pPA-pBB-pSO-pHR)

 p3B=p3B%*(pPA-pBB-pSO-pHR)

 pAVG=(p1B+p2B+p3B+pHR)/(pPA-pBB)

 pSLG=(1*p1B+2*p2B+3*p3B+4*pHR)/(pPA-pBB)

 pOBP=(p1B+p2B+p3B+pHR+pBB)/pPA

 pOPS=pSLG+pOBP

 

 打者については以上です。ここで計算されたp○○が要するに○○の予測値です。2008~2010年のデータを使ってpOPSが.850だった打者は、2011年のOPSが.850だろうとこのシステムは予測しているということです。

 

4.投手の成績予測算出方法

 投手の計算についても考え方は打者と全く同様です。説明は簡略化していきます。

 

 (1)打席(投球回)数の見積もりを立てる

 打者と同様に、出場機会を見積もります。投球回数のほうが考えやすい場合「投球回×4.5」とかで変換しても構いませんが、いずれにせよ計算には打席数を使用するため打席数の見積もりをしてpPAとします。

 

 (2)成績の信頼性を計算する

 過去3年間の打席数、BIP数を単純に合計して各指標の信頼性を計算します。ちなみに投手の場合被単打・被二塁打・被三塁打のデータが得られないため計算する指標は4つだけです。

 

 rBB%=PA/(PA+470)

 rSO%=PA/(PA+220)

 rHR%=PA/(PA+1360)

 rBABIP=(PA-BB-HBP-SO-HR)/((PA-BB-HBP-SO-HR)+5190)

 

 (3)過去の成績を加重して統合し、各指標の計算をする

 打者の場合と同じように、新しい年から4/3/2の比率で加重をして合計した上で指標を計算します。

 

 BB%=(BB+HBP)/PA

 SO%=SO/PA

 HR%=HR/PA

 BABIP=(H-HR)/(PA-BB-HBP-SO-HR)

 

 (4)指標の予測値を計算する

 

 pBB%=f(BB)*(rBB%*BB%+(1-rBB%)*lgBB%)

 pSO%=f(SO)*(rSO%*SO%+(1-rSO%)*lgSO%)

 pHR%=f(HR)*(rHR%*HR%+(1-rHR%)*lgHR%)

 pBABIP=f(BABIP)*(r1B%*1B%+(1-r1B%)*lg1B%)

 

 (5)各種予測値を計算する

 

 pBB=pBB%*pPA

 pSO=pSO%*pPA

 pHR=pHR%*pPA

 pIPH=pBABIP*(pPA-pBB-pSO-pHR)

 pIP=(pPA-pIPH-pHR-pBB)/3

 pK/9=9*pSO/pIP

 pBB/9=9*pBB/pIP

 pHR/9=9*pHR/pIP

 pRA=9*(0.52*IPH+1.41*pHR*0.30*pBB-0.10*(3*pIP))/pIP

 

 投手については以上です。最後のpRAはLWTSを基に計算された失点率で、これはあまり厳密ではなく別にRCとか他の方式で計算しても構いません。またピタゴラス勝率などを応用すれば期待される勝利数などを計算することもできます。

 

5.年齢による影響

 各指標に反映させている年齢による変化の係数は、結果から示すと打者では以下の表の数値を使用しています。

 

AgeBB%SO%HR%1B%2B%3B%
201.04 0.94 1.07 1.02 1.03 1.04
211.04 0.95 1.07 1.02 1.03 1.03
221.04 0.95 1.06 1.01 1.03 1.02
231.03 0.96 1.06 1.01 1.03 1.01
241.03 0.96 1.05 1.01 1.02 1.01
251.03 0.97 1.05 1.01 1.02 1.00
261.03 0.97 1.04 1.01 1.02 0.99
271.02 0.98 1.04 1.01 1.02 0.99
281.02 0.98 1.03 1.01 1.01 0.98
291.02 0.99 1.03 1.01 1.01 0.98
301.02 0.99 1.03 1.01 1.01 0.97
311.02 0.99 1.02 1.00 1.01 0.97
321.02 1.00 1.02 1.00 1.01 0.96
331.01 1.00 1.02 1.00 1.00 0.96
341.01 1.00 1.01 1.00 1.00 0.95
351.01 1.01 1.01 1.00 1.00 0.95
361.01 1.01 1.01 1.00 1.00 0.95
371.01 1.01 1.00 1.00 1.00 0.94
381.01 1.02 1.00 1.00 1.00 0.94
391.01 1.02 1.00 1.00 0.99 0.93
401.00 1.02 0.99 1.00 0.99 0.93

 

 目がチカチカする表ですがこれはなんなのかというと、「一般に対象の年齢において各指標の数値は前の年の何倍になるか?」を表したものです。Ageが25でHR%のところを見ると1.05となっていますが、これはつまり一般的に言って25歳のときの打席あたり本塁打は24歳のときの打席あたり本塁打に比べて5%増えるということを意味しています。

 数字がキャリアにおける絶対的な高さではないことに注意して下さい。たとえばBB%は1.04から1.00へと下降していきますが、これは年齢を重ねるごとにどんどん四球が減るということではありません。むしろずっと伸びているのですが、伸び率が減るというのが正しい見方です。

 したがって1.03や0.98といった数字はそれ自体では地味に見えても数年の経過で考えると結構大きなものになります。20代前半の本塁打率の伸び具合の平均(相乗平均)は1.06ですが、5年経てばこれが5回掛け合わさるわけですから1.06の5乗で1.35。20代前半の5年間で打席あたりの本塁打が35%増えるという意味の数字になっています。借金でいうところの複利だと言ったほうがピンとくる方もおられるでしょうか。

 

 ちなみにこの数字の根拠ですが、2010年シーズン終了時点でNPB公式サイトに通算成績が載っている現役選手のうち、1970年代以前の全選手のデータを元にしています。それらのデータから同じ選手が連続して2年出場した場合のデータとそれぞれにおける年齢をとり、各年齢について平均的な変化を集計しています。

 対象を絞ったのはコピペが可能とはいえ手集計の関係で効率的にキャリアの長い選手のサンプルを集めるためで、サンプルサイズの小ささという単純な問題も含めてここには色々な問題があってあまりアテにできるデータとは言えないのが正直なところです。

 集計データそのままでは不自然な乱高下が見られたため、移動平均でトレンドを出しそれをさらに関数で近似して強引に「キレイな」変化率の推移を出したのが表の数字です。ここでは「やらないよりマシ」程度のものとして考えています。

 

 投手の係数は次の表の通りです。

 

AgeBB%SO%HR%BABIP
200.87 1.01 1.11 0.98
210.88 1.01 1.10 0.99
220.89 1.01 1.09 0.99
230.91 1.00 1.08 0.99
240.92 1.00 1.08 0.99
250.93 1.00 1.07 1.00
260.94 1.00 1.06 1.00
270.95 0.99 1.05 1.00
280.96 0.99 1.05 1.00
290.97 0.99 1.04 1.00
300.98 0.99 1.03 1.01
310.99 0.99 1.03 1.01
321.00 0.98 1.02 1.01
331.01 0.98 1.02 1.01
341.02 0.98 1.01 1.01
351.03 0.98 1.00 1.01
361.04 0.98 1.00 1.02
371.05 0.97 0.99 1.02
381.06 0.97 0.99 1.02
391.07 0.97 0.99 1.02
401.08 0.97 0.98 1.02

 

 被本塁打が若いときにどんどん増えていくという不思議な数値ですが、これは指標そのものが打席あたりのシェアであるため与四死球の急速な減少と絡めて理解すべきところかもしれません(打席のうち四死球が減れば本塁打か三振かBIPのうちどれかが増えるのは必然です)。与四死球の推移は結構なもので、ベテランになると技術が円熟して無駄な四球は出さないというようなイメージもありますが四死球自体はどんどん増える傾向にあります。

 

6.予測の精度

 このような計算に、どれだけの効果があるのでしょうか。将来の成績は過去の成績と関連しているというのであれば、直前の年に打率が高かった打者は来年も高いだろうと予測するだけでもいいのではないかという見方もありえます。あるいは、サンプルサイズがもっと必要なのであれば過去数年の成績を単純に合算すればいいのではないか。予測方法だけ提示してそれで終わりではなんなので、簡単に確認作業をしてみます。

 簡単な検証として、2007年から2009年のデータを使って2010年の成績の予測を行い、その予測結果と実際の2010年の成績を比較して誤差を見てみました。対象とした選手は2010年に100打席以上の出場があり、かつ成績予測の数値が計算できた選手です。予測方法の比較対象として、直前の年(つまり2009年)の成績をそのまま予測値とした場合、2009年/2008年/2007年それぞれに4/3/2の重みを与えて合算したものを予測値とした場合の誤差も計測します。

 打率、長打率、出塁率、OPSにおいて予測値と実際の観測値との二乗平均平方根誤差(平均的にどれだけ誤差があるか)は以下のようになりました。

 

予測法打率長打率出塁率OPS
直前の年.071.119.077.188
直近3年.052.095.055.143
成績予測.040.070.041.104

 

 成績予測を使うのが最も誤差が小さいことがわかります。もちろんこれは自作自演といいますか、予測システムの構築にあたって2010年のデータが既に含まれているため、正しくは「予測」とは言えません。それでも最低限、単に直前の年の成績を持って予測と言うよりはマシだろうということの確認にはなるのではないかと思います。

 2010年に300打席以上出場した打者を対象にすると少ないサンプルによる揺らぎが少し排除され、予測の精度が上がります。

 

予測法打率長打率出塁率OPS
直前の年.063.096.073.164
直近3年.047.074.053.123
成績予測.034.055.034.083

 

 投手についても同じように、奪三振率・与四死球率・被本塁打率・BABIP・失点率の二乗平均平方根誤差を計算してみました。対戦打席100以上の投手では以下の通りです。

 

予測法奪三振率与四死球率被本塁打率BABIP失点率
直前の年2.17 1.88 1.02 .0853.13
直近3年1.67 1.33 0.67 .0632.24
成績予測1.50 1.05 0.57 .0411.84

 

 どの項目においても成績予測が最も誤差が小さいという点だけ見れば喜ばしいのですが、それにしても各項目の誤差の大きさはほとんど生データの標準偏差くらいあります(ただ単に平均値で予測としておけばこのくらいの誤差にはおさまる計算)。これだと果たしてわざわざ計算する意味があるのか、少々疑問です。

 対象を2010年に対戦打席300以上の投手にしてみます。

 

予測法奪三振率与四死球率被本塁打率BABIP失点率
直前の年1.35 1.32 0.92 .0722.20
直近3年1.17 0.83 0.40 .0371.18
成績予測1.11 0.75 0.33 .0311.10

 

 ここでも直前の年の成績をもって予測とするよりは遥かにマシなのですが、直近3年の成績を加重する予測との差はあまりなくなっています。ある程度出場することが安定的な投手に関しては、単に過去数年の成績を見ておけばいいのかもしれません。とはいえ成績予測の形式にすることによって少しはマシになっていることも事実です。

 

7.2011年度成績予測

 最後に、というかこれがそもそもの目的なのですが、2011年度の成績予測を載せておきます。計算の対象としたのは2010年に(対戦)打席50以上の出場があった選手で、出場機会の推定はそのまま2010年の打席数としています。また各選手の所属は2010年時点のもので集計しており、既に日本にいない選手なども含まれていますがお許しください。

 

2011年度打者成績予測
球団選手打席打率長打率出塁率OPS
D森野 将彦626 .302.505.383.888
D荒木 雅博625 .271.343.317.661
D和田 一浩602 .306.534.389.922
Dブランコ561 .270.515.349.864
D大島 洋平374 .258.334.326.660
D谷繁 元信367 .241.355.334.689
D堂上 直倫301 .274.402.342.744
D野本 圭277 .249.355.315.670
D井端 弘和212 .278.358.357.714
Dセサル194 .244.338.294.632
D藤井 淳志184 .265.389.312.701
D英智147 .245.334.293.627
D堂上 剛裕104 .264.394.319.713
D小池 正晃99 .248.387.316.703
D小田 幸平95 .251.342.311.653
D岩崎 達郎85 .256.378.328.706
D小山 桂司76 .234.325.302.627
D新井 良太60 .249.369.304.673
D松井 佑介56 .263.378.320.698
球団選手打席打率長打率出塁率OPS
Tマートン668 .311.459.366.826
T鳥谷 敬651 .286.446.366.812
T新井 貴浩641 .285.440.346.786
T城島 健司602 .300.500.354.854
Tブラゼル601 .280.532.323.855
T平野 恵一593 .289.353.346.699
T金本 知憲396 .265.450.356.806
T桜井 広大272 .271.435.345.780
T藤川 俊介183 .262.373.318.692
T浅井 良166 .263.395.318.713
T林 威助144 .264.400.313.713
T関本 賢太郎98 .273.386.355.741
T桧山 進次郎71 .242.338.303.641
T葛城 育郎66 .251.350.317.667
T坂 克彦59 .268.418.330.748
T大和50 .261.361.322.683
球団選手打席打率長打率出塁率OPS
G坂本 勇人676 .288.468.342.810
Gラミレス606 .308.579.350.929
G小笠原 道大591 .298.539.379.917
G阿部 慎之助569 .290.577.368.945
G長野 久義459 .286.476.337.813
G脇谷 亮太459 .257.357.315.672
G松本 哲也350 .273.337.325.662
G高橋 由伸332 .259.447.348.795
Gエドガー327 .267.441.341.782
G亀井 義行220 .268.444.326.770
G谷 佳知195 .282.423.334.757
G李 承ヨプ108 .251.465.337.801
G古城 茂幸96 .250.355.324.680
G矢野 謙次88 .271.410.343.752
球団選手打席打率長打率出塁率OPS
S青木 宣親667 .322.475.405.880
S田中 浩康637 .282.365.357.722
S宮本 慎也517 .280.367.323.690
S飯原 誉士492 .273.425.347.772
S相川 亮二474 .267.381.318.699
Sデントナ333 .262.467.328.794
Sガイエル309 .250.475.359.834
S畠山 和洋280 .278.449.362.811
Sホワイトセル268 .277.500.360.860
S福地 寿樹225 .265.352.317.669
S川端 慎吾214 .276.372.336.708
S藤本 敦士209 .254.345.309.655
S武内 晋一162 .262.396.334.730
S鬼崎 裕司96 .259.388.319.707
S川本 良平88 .247.382.313.695
S森岡 良介56 .258.376.326.702
球団選手打席打率長打率出塁率OPS
C梵 英心659 .273.389.337.726
C廣瀬 純546 .284.425.347.772
C東出 輝裕492 .277.334.325.659
C栗原 健太450 .291.472.366.838
C石原 慶幸408 .252.379.315.693
C天谷 宗一郎382 .261.361.335.696
C嶋 重宣377 .271.422.340.762
C赤松 真人320 .259.362.310.672
C小窪 哲也244 .260.349.336.685
C岩本 貴裕220 .269.478.311.790
Cヒューバー209 .261.423.350.772
C石井 琢朗165 .260.337.326.663
C木村 昇吾164 .256.359.319.678
Cフィオ151 .254.372.338.710
C倉 義和105 .250.352.309.662
C前田 智徳86 .257.382.314.697
C末永 真史66 .247.346.314.660
C會澤 翼56 .254.378.315.693
球団選手打席打率長打率出塁率OPS
B内川 聖一637 .316.461.371.833
B村田 修一617 .281.523.343.867
B石川 雄洋584 .263.328.298.626
Bスレッジ533 .267.493.353.845
Bカスティーヨ496 .280.457.328.785
B下園 辰哉461 .268.371.344.715
B武山 真吾298 .233.307.293.600
Bハーパー261 .289.540.366.905
B藤田 一也220 .274.359.307.667
B金城 龍彦149 .262.384.320.705
B橋本 将148 .252.373.334.707
B吉村 裕基141 .255.432.315.747
B井手 正太郎114 .253.358.308.667
B早川 大輔100 .244.332.304.637
B松本 啓二朗54 .264.402.333.735
B大西 宏明52 .253.351.330.681
B新沼 慎二52 .248.348.305.653
球団選手打席打率長打率出塁率OPS
H川崎 宗則662 .287.370.344.714
H本多 雄一651 .277.354.327.681
H多村 仁志559 .299.514.356.871
H長谷川 勇也519 .274.371.356.726
H小久保 裕紀469 .272.437.343.780
H松田 宣浩458 .272.460.315.774
Hオーティズ457 .280.483.343.825
Hペタジーニ307 .261.414.343.757
H松中 信彦267 .275.464.363.828
H田上 秀則255 .254.433.303.735
H山崎 勝己236 .233.323.287.610
H柴原 洋146 .257.363.323.685
H李 ボム浩139 .262.406.331.736
H森本 学119 .250.323.315.638
H明石 健志51 .252.351.310.661
球団選手打席打率長打率出塁率OPS
L栗山 巧660 .292.404.372.776
L片岡 易之643 .283.407.335.742
L中島 裕之579 .304.491.388.879
Lブラウン479 .266.455.341.796
L高山 久423 .271.417.332.748
L中村 剛也354 .271.592.354.945
L細川 亨341 .231.381.285.666
L石井 義人261 .281.397.349.747
Lフェルナンデス243 .293.469.355.824
L上本 達之232 .263.392.319.711
L原 拓也209 .251.344.333.677
L佐藤 友亮199 .260.342.319.661
LG.G.佐藤179 .277.478.343.821
L阿部 真宏157 .268.363.352.714
L平尾 博嗣126 .265.410.336.747
L大島 裕行121 .266.387.318.705
L坂田 遼114 .268.485.362.847
L大崎 雄太朗67 .267.372.330.702
L浅村 栄斗55 .280.438.364.802
球団選手打席打率長打率出塁率OPS
M西岡 剛692 .297.438.380.817
M井口 資仁650 .277.450.387.837
M金 泰均614 .265.431.351.782
M大松 尚逸603 .271.444.342.785
M今江 敏晃596 .295.435.336.771
Mサブロー513 .271.444.348.792
M福浦 和也359 .274.400.351.750
M里崎 智也295 .247.397.341.737
M清田 育宏223 .262.373.339.712
M荻野 貴司217 .277.381.344.725
M的場 直樹209 .224.313.285.598
M岡田 幸文161 .255.345.313.658
M南 竜介95 .253.393.321.714
M竹原 直隆79 .237.360.331.691
M根元 俊一61 .252.353.321.674
球団選手打席打率長打率出塁率OPS
F田中 賢介662 .297.393.380.773
F小谷野 栄一614 .290.432.336.767
F稲葉 篤紀591 .285.455.363.819
F糸井 嘉男583 .291.464.376.840
F森本 稀哲505 .261.326.337.663
F二岡 智宏355 .265.383.318.701
F金子 誠291 .268.394.315.709
F鶴岡 慎也284 .250.339.294.633
F陽 岱鋼281 .254.352.311.664
F高橋 信二272 .280.385.341.725
F中田 翔230 .262.422.325.747
F大野 奨太216 .259.386.326.712
F飯山 裕志160 .246.326.296.622
F坪井 智哉86 .256.333.310.644
F紺田 敏正76 .247.339.310.649
F高口 隆行76 .241.346.300.646
F今浪 隆博50 .264.373.329.702
球団選手打席打率長打率出塁率OPS
Bs後藤 光尊632 .285.432.332.764
Bs坂口 智隆622 .292.383.353.737
BsT-岡田520 .288.549.363.912
Bsカブレラ481 .303.532.392.924
Bsバルディリス434 .285.445.356.801
Bs北川 博敏403 .282.429.348.777
Bs赤田 将吾290 .246.369.310.679
Bs大引 啓次260 .259.363.330.693
Bs日高 剛243 .276.412.331.742
Bs鈴木 郁洋224 .222.294.288.583
Bs荒金 久雄204 .262.390.335.724
Bs山崎 浩司197 .259.359.315.675
Bsラロッカ158 .280.462.362.824
Bs森山 周149 .269.346.328.674
Bs田口 壮131 .262.391.322.713
Bsカラバイヨ125 .264.453.334.788
Bs下山 真二89 .260.419.338.757
Bs前田 大輔65 .256.369.323.692
Bs塩崎 真56 .244.348.319.667
Bs一輝53 .255.379.308.687
Bs金子 圭輔51 .248.346.315.661
球団選手打席打率長打率出塁率OPS
E山崎 武司598 .257.475.335.810
E聖澤 諒577 .275.371.328.699
E鉄平555 .296.430.372.801
E中村 紀洋521 .264.403.332.735
E嶋 基宏485 .274.351.342.693
E渡辺 直人425 .268.329.357.686
E高須 洋介421 .281.380.345.725
E草野 大輔378 .281.391.340.732
Eルイーズ312 .250.418.320.738
E内村 賢介270 .274.339.342.681
E牧田 明久190 .280.436.327.763
Eリンデン189 .247.408.330.738
Eフィリップス92 .270.452.345.797
E宮出 隆自88 .253.350.316.667
E枡田 慎太郎54 .261.371.334.706

 

 ちなみに……ここで対象に入っていないうち2011年の成績が気になる選手として松井稼頭央・岩村明憲のMLBからの出戻り両名がいます。彼らの成績を、日本時代の最後3年の成績を利用して年齢の要素をどんどん掛け算で適用して単純に時計の針を進める形で予測してみました。すると、松井は打率/出塁率/長打率が.317/.386/.571、OPS.957。岩村は.320/.405/.592でOPS.997。二人とも化け物です。考えてみれば、NPBにおいて頂点を極めたような状態にあったからMLBに移籍したわけで、単純にその成績から予測を行なえばこうなるのは当然とも言えます。この結果、私の順位予想において楽天の順位は上昇しました。

 正直なところ、この予測値は高すぎて嫌な感じがします。統計をやる人間であればそもそも全体の分布から見て高すぎる時点で黄信号がつくかと思います。リーグが違うとはいえMLBの成績を基に予測をすべきなのかもしれませんし、さまざまな変化の要因が絡んでいるために活躍は結局未知数だからリーグ平均値を予測値とするというのも賢いやり方かもしれません。しかしNPBに帰ってくることになったからにはMLBの直近の成績では何らかの問題を抱えている可能性が高く(故障で物凄く出場が少ないとか短期間出場したけど不運でやたら数字が悪いとか)そうすると妥当な予測は難しくなりますし、NPB・MLBと曲がりなりにもデータがある選手に関して平均値を予測値とするというのも芸がありません。いずれもひとつの手法として確立するには物足りないところがあります。

 個人的にはここでは、あえてNPBのデータ一本で他の選手と同じように予測を立ててみて結果が「どう間違うか」を見たいと思います。

 同じようにMLBから戻ってある程度出場した野手として新庄剛志・井口資仁・城島健司を参考にしてみると、日本時代最後のほうのOPSと復帰した年度のOPSでは後者のほうが75%くらい低い数字になっています。例えばこの数字を係数として上記の予測を補正するとOPSは7割台前半となり、物凄く下がります。OPS 1.000近くであればフル出場すればチームに与える得点の利得は+40くらいになることもありますが、7割前半は平均レベルですから±0です。二人合わせれば+80か0かで、どちらの数字をとるかで予測されるチームの成績は天と地ほど変わります。

 間をとってOPS8割中盤くらいで考えると妙にリアルなのですが、その予測をする理由付けをしっかりできなければわざわざこのように予測方法を考える意味がありません。特殊な場合は臨機応変で対応すればいいのではないかといっても、きちんとした土台のない臨機応変は気まぐれと変わりません。

 

2011年度投手成績予測
球団投手投球回失点率奪三振率与四死球率被本塁打率
Dチェン181 3.52 7.96 2.73 0.97
D吉見 一起154 3.67 6.94 2.08 0.97
D中田 賢一112 3.86 8.17 3.51 0.93
D山井 大介103 4.43 7.17 3.89 1.08
D浅尾 拓也72 3.32 7.96 2.32 0.82
Dネルソン64 4.61 6.81 4.20 1.11
D清水 昭信62 4.31 7.57 4.41 1.01
D高橋 聡文58 3.65 8.80 3.29 0.98
D岩瀬 仁紀46 3.92 7.21 3.21 0.83
D山本昌45 4.71 5.73 3.36 1.04
D平井 正史45 4.59 6.55 3.81 1.11
D朝倉 健太43 4.64 5.61 3.32 1.11
D鈴木 義広34 4.41 6.45 3.76 1.05
Dバルデス33 4.82 5.61 3.84 1.13
D川井 雄太33 4.57 4.91 3.20 1.00
D山内 壮馬32 4.48 6.38 3.66 1.12
D小笠原 孝26 4.70 6.15 3.39 1.24
D岩田 慎司19 4.17 7.47 3.50 1.11
D小林 正人19 4.17 7.28 3.41 1.03
D長峰 昌司18 4.08 7.32 3.29 0.98
D伊藤 準規13 4.13 7.28 3.16 1.16
球団投手投球回失点率奪三振率与四死球率被本塁打率
T久保 康友185 4.14 7.17 3.33 1.05
Tスタンリッジ119 4.17 7.17 3.72 0.92
T下柳 剛96 4.76 5.36 3.97 0.96
Tメッセンジャー77 4.65 6.07 3.57 1.14
T久保田 智之75 4.05 7.66 2.96 1.11
T鶴 直人75 4.50 6.04 3.53 1.11
T渡辺 亮70 4.14 7.11 3.97 0.93
T西村 憲69 3.92 8.25 2.73 1.19
T能見 篤史62 3.64 8.17 3.02 0.86
T藤川 球児61 3.01 11.47 3.17 0.95
T上園 啓史59 4.49 6.53 3.58 1.13
Tフォッサム57 4.60 7.21 3.98 1.16
T安藤 優也55 4.54 5.84 3.17 1.03
T秋山 拓巳38 4.21 6.35 2.92 1.14
T福原 忍23 4.76 6.19 3.78 1.17
T筒井 和也23 4.48 7.08 3.94 1.11
T江草 仁貴20 4.25 8.24 4.80 0.92
T藤原 正典19 4.27 6.29 3.06 1.09
T川崎 雄介14 4.44 6.61 3.43 1.10
球団投手投球回失点率奪三振率与四死球率被本塁打率
G東野 峻153 3.91 8.09 3.54 1.02
G内海 哲也146 3.90 6.99 2.66 0.98
Gゴンザレス133 4.07 6.42 2.74 0.92
G藤井 秀悟111 4.55 6.36 3.80 1.10
G久保 裕也87 3.76 8.62 3.25 1.00
G山口 鉄也85 3.47 8.28 2.62 0.91
G西村 健太朗72 4.53 5.58 3.20 1.10
G越智 大祐55 3.75 9.10 3.57 1.00
Gオビスポ50 4.64 6.22 3.44 1.24
Gクルーン50 3.45 11.01 4.45 0.86
G朝井 秀樹43 4.14 7.17 3.33 1.02
G福田 聡志40 4.60 6.22 3.80 1.14
GMICHEAL38 4.02 7.75 3.32 1.01
G星野 真澄35 4.65 6.68 3.84 1.23
Gグライシンガー22 4.01 6.32 2.20 0.96
G高木 康成22 4.63 6.06 4.04 1.07
G金刃 憲人20 4.42 7.02 3.51 1.16
G野間口 貴彦20 4.79 7.04 4.02 1.32
G豊田 清16 4.12 8.08 3.43 1.03
G小林 雅英14 4.74 5.66 3.73 1.05
球団投手投球回失点率奪三振率与四死球率被本塁打率
S石川 雅規179 4.30 4.89 2.07 1.11
S村中 恭兵172 4.09 8.02 3.86 1.03
S由規164 3.94 7.76 3.80 0.95
S館山 昌平140 4.01 6.53 2.47 1.05
S中澤 雅人107 4.95 5.78 3.34 1.39
Sバーネット83 4.49 7.31 3.98 1.11
S松岡 健一69 3.72 8.04 2.57 1.03
S押本 健彦57 4.00 7.26 2.72 1.10
S増渕 竜義57 4.55 6.81 4.23 1.15
S林 昌勇49 3.74 8.48 3.36 0.95
S松井 光介29 4.48 6.74 3.81 1.06
S橋本 義隆21 4.49 6.56 3.44 1.11
S李 恵踐16 4.42 7.33 3.74 1.14
S加藤 幹典16 4.91 5.48 3.62 1.24
S川島 亮15 4.66 6.58 3.76 1.24
S渡辺 恒樹13 4.57 6.33 3.76 1.06
S高木 啓充12 4.55 5.80 3.18 1.18
S高市 俊11 4.46 6.48 3.39 1.14
球団投手投球回失点率奪三振率与四死球率被本塁打率
C前田 健太200 3.53 7.09 2.17 0.98
Cスタルツ124 4.83 6.44 3.58 1.29
Cジオ112 4.30 7.38 3.56 1.11
C篠田 純平107 4.51 5.79 3.34 1.10
C齊藤 悠葵101 4.74 5.23 3.34 1.17
C青木 高広69 4.51 6.02 2.62 1.15
C岸本 秀樹63 4.51 6.59 3.69 1.05
C大島 崇行56 4.51 6.84 3.62 1.16
C横山 竜士46 4.02 8.07 3.90 0.95
Cソリアーノ44 4.65 6.24 3.55 1.20
C梅津 智弘42 4.50 6.58 3.40 1.21
C今井 啓介37 4.59 6.36 3.57 1.22
C高橋 建31 5.20 5.82 4.56 1.19
Cベイル27 4.69 6.90 4.31 1.09
C上野 弘文27 4.91 5.33 3.33 1.25
C林 昌樹26 4.73 6.13 3.59 1.15
C中田 廉25 4.46 6.73 3.47 1.25
C小松 剛25 4.57 6.59 3.21 1.25
Cチューク20 4.47 6.48 3.62 1.04
C大竹 寛19 4.32 6.01 3.53 0.93
C永川 勝浩13 4.01 8.06 3.93 0.94
球団投手投球回失点率奪三振率与四死球率被本塁打率
B清水 直行156 4.64 5.96 2.96 1.12
B加賀 繁140 4.34 5.71 2.61 1.10
B大家 友和117 4.63 5.30 2.77 1.13
Bランドルフ85 4.43 8.51 5.28 1.00
B三浦 大輔83 4.42 6.67 2.74 1.24
B真田 裕貴67 4.72 5.59 3.47 1.19
B山口 俊66 3.53 9.92 3.33 1.07
B寺原 早人53 4.36 7.00 3.63 1.09
B江尻 慎太郎52 4.58 6.65 4.12 1.04
B牛田 成樹49 3.82 10.11 4.16 1.09
B阿斗里48 4.67 6.10 3.26 1.31
B藤江 均42 4.61 6.68 2.97 1.36
B小林 太志37 4.87 5.64 3.79 1.24
B弥太郎31 4.54 6.06 3.51 1.08
B加藤 康介30 4.48 7.91 4.43 1.10
Bブーチェック27 4.38 7.27 3.38 1.14
B桑原 謙太朗26 4.66 6.47 4.23 1.14
B小杉 陽太24 4.81 6.24 3.42 1.34
B田中 健二朗23 4.54 6.27 3.20 1.27
B福田 岳洋22 4.56 6.69 4.00 1.12
B高崎 健太郎16 4.16 6.92 2.76 1.09
B高宮 和也12 4.50 6.89 3.72 1.11
B篠原 貴行12 4.67 6.23 3.70 1.09
球団投手投球回失点率奪三振率与四死球率被本塁打率
H杉内 俊哉183 3.13 10.05 3.05 0.75
H和田 毅162 3.54 8.62 2.92 0.86
H大隣 憲司110 4.08 7.71 3.16 1.06
H小椋 真介103 4.38 9.03 4.90 1.06
Hホールトン79 4.10 7.93 3.15 1.08
H攝津 正74 3.11 10.21 3.45 0.72
H甲藤 啓介74 3.84 7.99 3.59 0.83
H山田 大樹59 4.33 7.10 4.06 0.97
H馬原 孝浩57 3.47 8.42 2.91 0.75
Hファルケンボーグ55 2.73 10.58 2.48 0.65
H藤岡 好明54 3.81 8.01 3.50 0.82
H金澤 健人44 4.49 6.38 3.88 0.95
H森福 允彦43 3.75 8.13 3.07 0.93
H陽 耀勲33 4.24 7.52 4.28 0.87
H高橋 秀聡24 4.29 7.60 4.17 0.94
H岩嵜 翔24 4.30 5.85 3.13 0.94
H神内 靖17 4.14 8.09 3.96 0.98
Hダービン16 4.35 7.08 3.88 0.97
H水田 章雄15 4.66 5.54 3.68 0.88
H大場 翔太13 4.16 8.50 4.25 0.98
H吉川 輝昭11 4.52 6.20 3.59 0.98
球団投手投球回失点率奪三振率与四死球率被本塁打率
L涌井 秀章190 3.70 7.68 3.10 0.88
L帆足 和幸157 3.94 6.42 2.75 0.77
L許 銘傑115 4.72 5.14 3.54 0.90
L岸 孝之106 3.74 7.87 2.83 0.96
L石井 一久101 4.31 8.14 4.15 0.99
L野上 亮磨71 4.59 5.86 3.33 1.08
L長田 秀一郎62 3.95 8.01 3.71 0.86
L平野 将光61 4.58 6.11 3.19 1.13
Lシコースキー58 3.78 8.53 3.37 0.91
L西口 文也56 4.95 6.64 4.41 1.11
L岡本 篤志43 4.20 7.25 3.75 0.88
L藤田 太陽41 4.26 6.76 3.11 1.00
L小野寺 力38 4.09 7.00 3.46 0.85
L大沼 幸二24 4.42 6.73 4.23 0.86
L土肥 義弘20 4.56 6.12 3.78 0.90
L武隈 祥太17 3.91 7.57 3.44 0.89
L星野 智樹14 4.46 6.94 4.64 0.83
L田中 靖洋14 4.13 6.81 3.27 0.93
球団投手投球回失点率奪三振率与四死球率被本塁打率
M成瀬 善久194 3.41 8.54 2.04 1.04
M渡辺 俊介143 4.52 4.89 3.42 0.78
Mマーフィー138 4.22 7.90 4.70 0.83
M大嶺 祐太71 4.58 6.45 3.53 1.14
M唐川 侑己71 3.63 6.98 2.37 0.82
M薮田 安彦62 4.23 7.71 3.79 0.95
M伊藤 義弘62 3.70 8.72 3.85 0.75
M小野 晋吾57 4.73 5.40 3.75 0.91
M小林宏57 3.80 7.75 3.25 0.80
M古谷 拓哉54 4.16 7.81 4.22 0.87
Mペン43 4.32 6.56 3.43 0.98
Mコーリー43 4.56 6.80 3.94 0.99
M川越 英隆32 4.48 5.64 2.79 0.92
M秋親32 4.39 7.67 4.54 0.91
M内 竜也19 3.85 8.45 3.66 0.91
M大谷 智久16 4.27 6.30 3.17 0.95
M上野 大樹15 4.15 6.53 3.52 0.85
M根本 朋久14 4.15 6.54 3.36 0.88
M松本 幸大13 4.59 6.61 3.87 1.01
M香月 良仁13 4.23 6.73 3.36 0.92
M吉見 祐治2 4.45 7.15 3.54 1.04
球団投手投球回失点率奪三振率与四死球率被本塁打率
Fダルビッシュ 有194 2.63 9.56 2.52 0.58
F武田 勝153 3.86 6.15 1.88 0.93
Fケッペル148 4.36 5.69 3.59 0.83
F榊原 諒64 3.71 7.40 2.56 0.87
F増井 浩俊60 4.64 6.17 4.01 1.03
Fウルフ57 4.44 5.44 3.19 0.90
F武田 久54 4.21 6.34 3.25 0.85
F木田 優夫50 5.00 6.04 4.58 0.99
F建山 義紀50 3.56 8.35 3.00 0.74
F宮西 尚生42 3.49 8.76 3.03 0.87
F八木 智哉40 4.74 6.49 3.72 1.21
F金森 敬之38 4.60 6.04 3.44 1.09
F糸数 敬作35 4.71 6.00 3.76 1.16
F矢貫 俊之29 4.31 7.15 3.57 1.01
F林 昌範28 4.05 7.99 3.96 0.93
Fカーライル28 4.45 6.34 3.74 0.89
F吉川 光夫27 4.52 7.23 3.69 1.19
F中村 勝18 3.98 7.28 3.19 0.97
F菊地 和正18 3.71 7.76 2.85 0.83
F加藤 武治18 4.17 7.66 3.56 0.95
F谷元 圭介15 4.29 7.06 3.70 0.99
球団投手投球回失点率奪三振率与四死球率被本塁打率
Bs金子 千尋195 3.44 8.28 2.29 0.88
Bs木佐貫 洋170 4.23 7.21 3.89 0.86
Bs近藤 一樹138 4.37 6.93 3.79 1.00
Bs山本 省吾107 4.50 6.33 2.84 1.06
Bs岸田 護103 3.40 8.09 2.17 0.78
Bs小松 聖85 4.34 7.18 3.30 1.05
Bs平野 佳寿77 3.61 8.84 3.11 0.88
Bs香月 良太54 4.27 5.77 3.21 0.85
Bs中山 慎也49 4.34 6.72 3.70 0.90
Bsレスター40 4.15 7.36 3.86 0.83
Bs西 勇輝29 3.77 8.11 3.24 0.95
Bs鴨志田 貴司26 4.08 8.33 4.11 0.93
Bs古川 秀一25 3.88 7.68 3.41 0.87
Bs伊原 正樹24 4.65 6.22 3.98 1.05
Bs加藤 大輔23 3.97 8.12 3.52 0.92
Bs比嘉 幹貴18 3.97 6.94 3.05 0.86
Bs阿南 徹17 4.31 6.91 3.70 0.95
Bs前田 祐二12 4.10 7.13 3.36 0.93
Bs菊地原 毅11 4.41 6.75 3.61 0.92
Bs長谷川 昌幸6 4.95 5.81 4.16 1.08
球団投手投球回失点率奪三振率与四死球率被本塁打率
E岩隈 久志191 3.45 7.08 2.46 0.67
E永井 怜176 4.13 7.29 3.39 1.03
E田中 将大151 3.34 7.87 2.39 0.73
Eラズナー149 4.36 6.81 3.70 0.96
E川井 貴志66 4.83 5.18 4.03 0.91
E片山 博視58 3.68 8.35 3.75 0.80
E小山 伸一郎57 3.77 9.04 3.90 0.86
E川岸 強51 4.37 7.28 3.71 0.99
E青山 浩二50 3.83 8.35 3.24 0.91
E長谷部 康平43 4.98 6.03 4.20 1.16
E山村 宏樹40 4.50 6.16 3.60 0.93
E井坂 亮平36 4.68 5.23 3.38 1.00
E松崎 伸吾28 4.42 6.71 3.70 0.99
E佐竹 健太21 4.15 7.49 3.85 0.86
E戸村 健次19 4.20 7.08 3.47 0.98
E藤原 紘通17 4.57 6.01 3.52 1.04
E松本 輝17 4.79 5.72 3.96 0.95
E木谷 寿巳14 4.37 6.86 3.71 0.99
E辛島 航13 3.98 7.13 2.99 0.97

 

トップ > 分析・論考 > 2011年度成績予測

ページのトップへ戻る
inserted by FC2 system