2020.9.5
1イニングに見込まれる得点数(R/I)は「1打席に見込まれる得点数(R/PA)」と「1イニングに見込まれる打席数(PA/I)」の掛け算に分解できます。
仮に1打席に見込まれる得点が0.1であれば、それが4打席あれば0.4点が見込まれるのは論理的に当然です。
R/I = R/PA * PA/I
このうちR/PAは打者が出塁する確率(OBP)と生還する確率(SCORE%)の掛け算となります。出塁した数のうち生還した分が得点になるという分解です※1。本塁打では出塁と生還が同時に起こります。
R/PA = OBP * SCORE%
ここで、Tom Tangoによれば生還率は「とてもざっくり」言うと出塁率に等しくなります。出塁率が.000に近いときは走者がほぼ出ず生還することもできませんから生還率も0%に近く、逆に出塁率が1.000に近いときは大量の走者が出てほとんどが押し出されて生還することから生還率も100%に近くなります。それほど極端でない中間部分でも連関はあるはずだと推論できます。
出塁率を.330とすればOBP=SCORE%=0.33となり、R/PAは0.33*0.33=0.1089、一般的にプロ野球で発生している打席あたりの得点は0.1くらいですから勘定は合っています。そして”打席あたりの得点は”出塁率の二乗に比例することになります。
他方、イニングに見込まれる打席数(PA/I)も出塁率の関数となります。
PA/I = 3 * ( OBP / ( 1 - OBP ) ) + 3
打席の結果は出塁かアウトかいずれかです※2。イニングにつきアウトは3つまでですからアウトの打席は3で固定、出塁する打席の数はアウトに対する出塁の比率で計算できます。出塁率に0.33を代入するとPA/Iは4.48です。
出揃った要素からR/Iを計算してみます。
R/PA = OBP * SCORE% = 0.33 * 0.33 = 0.1089
PA/I = 3 * ( OBP / ( 1 - OBP ) ) + 3 = 3 * ( 0.33 / ( 1 - 0.33 ) ) + 3 = 4.48
R/I = R/PA * PA/I = 0.1089 * 4.48 = 0.48761194
出塁率を.330とした場合のイニングあたりの得点数は0.49と求められました。ちなみに9倍して9イニングあたりの得点数に換算すると4.39となり、おおむね一般的な1試合あたりの得点数と一致します。
何らの経験的なデータも用いず、数理的な構造からアプローチして0.33だけを変数として入れれば1試合の得点数を導くことができるのはなんとなく面白いような気がします。
R/PAの中に「出塁率の二乗」の法則が出現しましたが、PA/Iの中にも「OBP / ( 1 - OBP )」という項が出てきます。
出塁率が上がれば個々の打席の得点見込み(R/PA)が上がるのは当然ですが、それに加えて出塁率の上昇にはイニングにおける打席数自体を増やす効果があることがPA/Iに表れています。しかも出塁率の上昇に対して一定率の効果ではなく出塁率が上がるほどテコのように大きな力が働きます。
出塁率0~1の範囲でPA/Iをグラフにしてみました(厳密には出塁率100%のときは永遠に打席が続くので図示できませんが)。
ただし急速な変化を見せているのは出塁率9割前後の部分であり、一般的な.300~.360くらいの範囲ではそれほどグラフは曲がらず、単に出塁率が増えれば直線的にイニングあたりの打席数も増える関係になっています。それでも出塁率が打席数を増やす効果は無視できません。
実際に出塁率から具体的なチームの得点がどの程度説明できるのでしょうか。試しに2005~2019年NPBのチーム打撃成績から、前述の計算式で出塁率から推計した得点率と実際の得点率との比較を散布図にしてみました。
なお、ここでは公式記録の価値判断に依存せず上記の数理的な定義に近付けるため、出塁率は犠打も分母に含める形の「( H + BB + HBP ) / PA」で計算しています。また実際の得点率はチームの得点数を「AB - H + CS + SF + SH + GIDP」の推定アウト数で割って27倍した値としています。
決定係数が.77、平均的な誤差を表す二乗平均平方根誤差※3が.28という精度になりました。ちなみに比較対象としてRC(Basic)(後述)では決定係数.91、二乗平均平方根誤差.19です。
既に種々の得点推定式を知っている立場から見るとどうということのない精度に思えるかもしれません。しかしこれは長打や走塁などほとんどの事柄を捨象し、出塁率だけに変数を絞って簡単な数理的必然から計算した結果です。それでこれだけ(攻撃の目的たる)得点に近似した数字が出せるのは現実世界のビジネスや社会科学的調査を思えば驚異的ではないかと感じます。
野球における得点の構造は骨格を抜き出せば単純であり、さらにその中枢にあるのは出塁率だと理解できます。
なおこれは筆者の肌感覚に過ぎない余談ですが、米国セイバリストの思考において出塁率は単なる打者の評価指標という範疇を超えた特別な地位を占めているように思われます。そしてその背景には得点の構造を考えるときほとんど常に出塁率が出発点となり、野球における本質的な要素だからという理由があるのではないでしょうか。
これに対して例えば打数に占める安打の割合を表す打率は、こうした理論的な検討において姿を現す場面がありません。セイバリスト達の精神世界において、このことは「打率よりも出塁率の方が得点との相関関係が少し強い」といった経験的事実よりもよほど重要であると推察します※4。
もちろん出塁率と生還率が等しいのはざっくりとした傾向であって、個々のチームで見たときには長打力や走力の高いチームほど出塁率に比して生還率が高くなります。
公式記録の中で出塁率と同じような感じの数字で進塁の多さを加味したものはないだろうかと考えると、長打率が候補に挙がります。そしてR/PAの生還率を長打率で置き換えてみると、これはOPSよりも古くから提唱されている打撃指標であるOXSとなります※5。長打率が正確に生還率を表せるかは近似の精度の問題に過ぎませんし、あくまでも程度問題です。
OXS = OBP * SLG
そしてBill JamesのRCの基本形はこれに打席数を掛けたのに近い形となっています※6。
RC(Basic) = ( H + BB ) * TB / ( AB + BB )
RCやOXSの計算式は一見意味が不明瞭ですが、3アウトを消費する間に出塁・生還して得点を生み出すという構造から出発して生還率の部分をとりあえず長打率で置換した指標と考えればそれほど無理なく理論の中に位置付けることができるのかもしれません※7。
ところで打席あたりの得点数が出塁率と生還率の積であり出塁率と生還率の値が等しいことを出発点とすると、出塁率と生還率どちらの1単位の上昇も、打席あたりの得点数に対しては等しいインパクトを持ちます。そう考えると出塁率と長打率を1対1の比重で加算した指標であるOPSについても、平均を基準とした限界的な近似という理解の仕方もあり得ます。
OPS = OBP + SLG
Pete PalmerによればOPSは「LWTSの近似であるOPS+の近似」ですが、そもそもLWTS自体、一連の打線の流れで成り立っている攻撃から打席ひとつひとつを切り出して限界的な変化を見る分析方法と整理できます。
こうして見ていくと得点の構造をモデル化したRC、RCを打席あたりの指標にしたOXS、OXSを計算しやすい加算式で置き換えたOPS、OPSの精密版であるLWTS……といったように一連の指標をリンクさせることもできそうです。どこから出発してもそれぞれを合理的な存在理由を持つ関連指標として説明できます。そしてそれら全てを背後から支えるのは出塁率を根幹とする得点構造です。
※1 話は逸れますが筆者はこのように「出塁し、出塁した走者を還すことで得点が生まれる」という構造理解から、通常時の打率よりも得点圏打率が高いことを有り難がる風潮(それが現にどのくらいあるかはわかりませんが個人的に感じることがあります)に対して素朴な疑問を覚えます。得点創出のためには出塁することと還すことのどちらも重要で両者のバランスがいいときに多くの得点が生まれるのであって、活躍の絶対量が多いのはもちろん良いことですが相対的な偏りに対しては「得点圏打率が高い」とも「非得点圏打率が低い」とも言え、その是非は一概には評価できないはずです。ポイントゲッターとなる打者(打順)だけを念頭に置いた考え方なのかもしれませんが、それでも打線はひとつながりです。
※2 J.アルバート・J.ベネット(後藤寿彦監修・加藤貴昭訳)『メジャーリーグの数理科学(下)』11頁(シュプリンガー・フェアラーク東京2004)では「全ての打者はアウトになるか、得点するか、または塁に残る」ことが「打者保存の法則」と説明されています。得点と残塁はいずれも出塁の結果です。
※3 二乗平均平方根誤差は各サンプルに対して予測値と観測値の差の二乗を計算し、それらの平均値の平方根をとることで計算されます。
※4 Tom Tangoは、wOBAの作成にあたり何故打率のスケールではなく出塁率のスケールに合わせたのかを説明する文脈で、出塁率はずっと存在するが打率は将来出塁率に取って代わられるかもしれず、いずれにせよひどいスタッツである旨述べています。筆者としてはひどいひどくない以前に野球を分析する上で打率を尺度とすることが自然な場面に一度も出くわしたことがない印象です。
※5 OXSについては拙稿「ほとんど無害なセイバーメトリクス」も参照。
※6 より正確には(出塁率から死球・犠飛を外した上で)打席ではなく打数を掛けるとRCになります。
※7 ただしこのあたりの話は筆者なりの解釈を述べているに過ぎず、指標の開発者らがこのような発想で指標を生み出したと説明あるいは推測するものではありません。ちなみにDick Cramerはコンピュータシミュレーションを通じた試行錯誤でOXSを発見したようなことを言っていますし、独立にOXSを発見していたPete Palmerはそれをチームの指標と捉え、打力の高い個人にあてはめると極端な結果が出ることからOPSに切り替えた旨述べています。
関連記事:
トップ > 分析・論考 > 得点の構造と出塁率