基本的な考え方

by Baseball Concrete

主観に頼らない

 さまざまな評価を行う際に主観に頼らないことはセイバーメトリクスで最も重視される考え方のひとつです。誰かがある選手を見て、バッティングフォームが美しいからこのチームで最も優れた打者に違いないと確信したとしても、その打者が実際によく打っているかはわかりません。ひいきチームの試合をたまに見るファンがある打者がよく打っていると感じたとしても、それはたまたま見ているときにその打者がよく打っているだけでありシーズン全体ではさほど活躍していないかもしれません。

 人の知覚や記憶といったものは多くの面で極めて優れた要素を持ってはいますが、得手不得手はあります。感情に左右されずに無機質に情報を収集・記録しておくことなどはどちらかといえば苦手でなかなか難しいものです。最初に選手を見たときに印象が悪ければ、その後はいくらか活躍しても悪いように見てしまいがちになるなどの思考の癖もあります。

 物の長さを正確に知りたいとき定規を使うように、あるいは用事を忘れないために手帳にメモしておくように、主観以外のものさしや記録を用いることには意義があります。従って、客観的に選手を評価するにあたっては「あの打者がよく打っているイメージがある」などの主観に頼らずに、どれだけの安打を打ったか、四球を選んだかなど誰にも同じように確認でき記録されていることを基に評価を行います。特定の解析にあたって直接のデータがない場合でも、その他の事柄から論理的に筋道を立てて意見・主張を裏付けます。

 そうすることにより、実際はよく勝利に貢献しているがプレーの見た目が地味なために主観的判断では評価されにくい選手なども公正に評価されるようになります。また、思い込みを覆して新たな戦略・戦術を生み出す契機になる可能性もあります。

 セイバーメトリクスによる評価も人間が考えるものですからその意味で完璧に客観的であるということはありえませんが(全ての科学がそうです)、単にイメージで語ることと誰にでも確認できる論理的な筋道を立てて記録から評価をすることには大きな違いがあります。

 

統計データの意味

 セイバーメトリクスでは安打数や四球数などの統計データを元に解析を行います。これに対して、現実を数字で語っていいのか、数字は過去のものでありそれで選手の能力を評価する指標などは虚しい机上の空論ではないかといった批判が存在します。

 それらの批判は指摘のポイントとしては核心を突いた重要なものです。現実は複雑ですから完璧にモデル化することはできませんし、過去はすでに過ぎ去ったものです。

 しかし統計データが無益なものかと言えば、そうではありません。数字というのは確かに抽象化されたもので、それ自体は現実ではありませんが、扱っている数字は誰が安打を何本打ったかなどの事実の記録です。統計データを解析するということは過去の現実、経験を見つめることに他なりません。過去によく安打を打った選手はその後もよく打つ傾向があるなどのことが明らかであれば、打っていない選手よりも打っている選手に期待をかけることは妥当であり、未来を考える上でも有意義です。

 このような「過去の経験を整理して未来に活かす」ことは誰しも日常的に行っていることであり、統計学的な手法はそれを定量的に厳密に行っているだけだと見ることもできます。厳密というのは間違いがないということではなく、「こういうふうに予測をしたら誤差がこれだけある」というように間違いの程度も含めて正直に把握しておくということです。

 料理をするときに、細かく言えば食材の状態などは毎回異なるわけですが、どの食材をどの手順で調理して調味料をどのように配合するかを決めておけば、だいたいいつも同じような味にすることはできます。知り合いと話すとき、相手がどのような話題に興味を持っているかを覚えておけば楽しく会話をすることができます。こういうことを数字に置き換えると抽象的なものになるように感じることもありますが、実質的な中身は単に過去の経験を記録・整理しているだけであり、現実は複雑で未来は不確定とはいっても完全に予測不能なわけではなくレシピ通りに作れば料理の味がだいたい予想できるように「こういう推定でこのぐらいのことはほぼ間違いない」と言える範囲はあります。これに対して「同じ野菜などふたつと存在しないのだから未来は全く予測不可能だ」と“全て”を否定するのはナンセンス・非建設的でしょう。どのようなことが数量的に傾向が出るかを探求し把握しておくことはさまざまな場面で有益です。単なる数字だから現実と離れているとか、過去のものだから意味がないわけではありません。

 もちろん記録が得られた前提条件を無視して加工を行ったり根拠のない補正をしたりなど数字の扱いを誤れば現実の事情とかけ離れた机上の空論になってしまう可能性はありますが、そうならないためにこそ数字の研究であるセイバーメトリクスが存在するわけです。

 

目的は勝利

 野球の試合の目的は勝つことです。

 従って、選手や戦術の評価などはいかに勝利に有効であるかを基準に考えます。

 野球の試合ではしばしば「すごいプレー」が見られますが、「すごいプレー」と「勝利に有効なプレー」は必ずしも一緒ではありません。

 例えば外野手が、フラフラと上がり内野手の頭を越えてポテンヒットになりそうな飛球を猛ダッシュでスライディングキャッチしたとして、そのプレー自体に芸術的な価値はあるかもしれませんが構造的な試合への影響としてはあくまで安打を1本防いだという分だけです。プレーの難易度なんかが問題になるのではなく、勝利に繋がるのは何かです。

 勝利のための条件は自軍の得点が失点を上回ることですから、基本的にはいかに得点を増やすかそしていかに失点を防ぐかということが評価の対象になります。

 「内角球に対して上手く肘を畳んで打つことができる」

 「ストレート、変化球、どれでもストライクを取れる」

 「捕ってから投げるまでが非常に速い」

 これらはそれ自体が目的なのではなくあくまで勝利を達成するための手段です。手段と目的は違い、野球の目的は勝利です。

 もっとも、セイバーメトリクスはその言葉を作ったビル・ジェイムズによる定義が「野球についての客観的な知識の研究」とのことですから、セイバーメトリクスを行うという意味では野球に関して客観的に研究を行うのであれば何も勝利というものを常に意識する必要はない、ということになるかもしれません。以下において私が思う「セイバーメトリクスをする上で抑えておきたい考え」という事柄を書きますが、厳密には私が志向する狭義のセイバーメトリクスと言わなければならないでしょう。そのあたりはどうぞ承知しておいて下さい。

 

具体的な重みを計る

 勝利に繋がる要素を探したとして、ただ列挙するだけでは重要性がわかりません。

 例えば「打者Aは四球を多く選ぶ」という評価と「打者Bは本塁打を多く打つ」という評価があるとします。

 これらは性質を挙げただけであって、これだけではどちらが優秀かについての結論は出ません。どちらもそれ自体勝利へ有効な要素であるとしても、どのようにどのくらいというのが明らかでないためです。

 そもそも四球というのはチームの得点にとってどのくらい有効なものであるのか、あるいは四球を多く獲得することによって打者Aが結局どれだけチームの得点を増やしたと評価できるのか。そういったことについての具体的な測定が重要です。

 最終的に打者Aと打者Bを「どのくらい得点に貢献したか」という具体的なデータで同じ土俵に乗せることができたならば、適正に両者を比較することができます。幸い投手についてはどのくらい点を取られるかの直接的なデータ(防御率)が存在するわけですが、いずれにせよそれぞれの活躍を同じ土俵で具体的に評価することが重要であるということです。

 

得点期待値

 野球の各プレーはどのような価値を持っているのか。それは言い換えると各プレーが得点の増減にどのように関与しているかということになります。そういったことを客観的かつ具体的に明らかにするために、得点期待値というものが開発されています。

 得点期待値はイニングにおけるアウト・走者状況別の各局面それぞれの出現とそこからイニング終了までに記録された得点を詳細に記録し、局面ごとの平均値を表したもので、昔のメジャーリーグのデータによるものを引用します。

得点期待値表
アウト\走者走者無し一塁二塁三塁一・二塁一・三塁二・三塁満塁
無死0.461 0.813 1.194 1.390 1.471 1.940 1.960 2.220
一死0.243 0.498 0.671 0.980 0.939 1.115 1.560 1.642
二死0.102 0.219 0.297 0.355 0.403 0.532 0.687 0.823
 出典:J.アルバート・J.ベネット著(後藤寿彦監修、加藤貴昭訳)『メジャーリーグの数理科学(上)』219頁(シュプリンガー・フェアラーク東京2004)。ただし表の形式は変更している。

 無死無走者、イニング開始時点で0.461点が期待されるということは、9ニングあたり4.14点、これはわりと現在のNPBに近い投打バランスです。そして一死一塁の局面があるときそこから見込める得点は平均的に何点かといえば、一死の行と一塁の列を見て0.498だな、というふうに見ます。

 この表によって無死満塁でどのくらい点が入ると考えられるのかとか、一死一塁と二死二塁はどちらが得点を期待できるのかといったことがわかります。そして、あるイベントの事前と事後で状況の変化が見られるならば、それぞれの期待値の差をとればあるイベントがどのように得点に影響したか(具体的な重み)が評価できるわけです。

 例えば無死無走者からヒットで一塁に出た場合期待値を0.461から0.813に上昇させたためその差分0.352点がそこでの貢献とみなせます。次の打者が三振に倒れた場合アウトをひとつ増やすだけで0.498-0.813=-0.315。一定の得点が期待されるのでマイナスの貢献というのもあります。

 得点というのは野球においてひとつ絶対的な単位ですから、このような考え方を用いることによって気まぐれでない現実的なプレーの重みが表れます。単打、二塁打、三塁打、本塁打など各打撃イベントについて得点期待値に与える平均的な影響をまとめて指標にしたのが打撃得点(Batting Runs)と呼ばれるものです。

 打撃得点 = 0.47×単打+0.78×二塁打+1.09×三塁打+1.40×本塁打+0.33×(四球+死球)+0.30×盗塁-0.60×盗塁刺-0.25×(打数-安打)

 シングルヒット1本には平均して0.47点の価値があり、二塁打は0.78点、三塁打は1.09点……という具合です。これは平均的に見込まれる得点数に対しての増減ですから、各打者の打撃成績に適用した場合「同じ打席数を平均的な打者が打つ場合に比べて多く(または少なく)生み出した得点数」を表すことになります。

 「打点」では走者を帰した打撃のみが評価されますがこちらはいかなる場合にもイベントに平均的な価値を見込むため出塁や繋ぎも評価されます。仮にチームから平均的な打者を除き代わりに打撃得点が20の打者を置いた場合、チームの総得点が20増加すると考えられます。得点期待値及び打撃得点の加重は、具体的であると同時に現実の記録ですから客観的でもあります(このようにプレーに一定の得点価値を掛けあわせて評価することをリニアーウエイトシステム、LWTSといいます)。

 打撃得点は得点期待値の考え方の代表的な利用法のひとつですが、得点期待値はその他多くのことに利用可能で、盗塁や犠打の価値を判断するのにも利用されます。前述した勝利(及び得失点)に照準を絞ること、客観的・定量的な議論をすることを重視する上で欠かせない概念です。そして選手の優劣を判断するために平均などの基準を持ち出して比較するということもセイバーメトリクスの典型的な手法です。

 プレーを得点の価値に変換すればタイプの異なる様々な打者の比較はもちろん、打者と投手、打者と守備者といった比較も可能になります。

 また、期待値ではなく少なくとも1点取る確率を表した「得点確率」がよくセットで用いられる他、得点ではなく勝利の確率自体を局面ごとに数値化した勝利期待値と呼ぶべきものも存在します。

 

責任の所在

 勝利に結びついた定量的な情報でも、運用方法を誤ると的外れなものになります。

 仮に「A選手が出場した試合での勝率」というデータを集めたとして、ひとつの記録としては成り立ちますが、それにA選手個人の能力が的確に表れると考える人はあまりいないでしょう。A選手が活躍しなくても他の誰かが活躍して勝ったり、逆にA選手が活躍しても他の選手が足を引っ張って負けたりすることは十分に考えられるので、勝敗自体を個人の責と捉えるのは無理があるからです。選手の評価にこのような統計を使えば価値を見誤ることになると思われます(投手についてはそんなような記録が用いられていますが……)。

 そういった問題を回避するために、能力を評価する際にはなるべく本人の働きによると推測される項目だけを利用することになります。

 打点は、打席に入る時どれだけ走者が居るかはその打者個人がどうにかできる問題ではありませんから個人の能力に結びついていないとしてセイバーメトリクスでは基本的に無視されます(よく打っても打席に入った際の走者数が少なかったがために低く評価されるのはいかがなものかということ)。また犠牲フライも、同じように打っても走者の出現の仕方によって左右されるという意味では打点と同じようなものとも言えると思います。考え方の分かれるところかもしれません。

 投手については「被本塁打、与四死球、奪三振以外は投手の責任ではない」とする従来の常識からすると驚くべき理論があり、これはDIPSという指標として定着しています。考えてみれば強い当たりを野手がたまたま好捕してくれるかもしれないし、ボテボテを緩慢な動きで内野安打にしてしまうかもしれません。これらは投手の責任と言い切れませんから、完全に無視するかは別にして、一旦切り離してみるというひとつの視点があっても何ら不思議ではないのかもしれません。

 これらは、統計学的にいえば偏り(バイアス)やノイズを排除するということです。調査の対象を的確に捉えにいくという意味では、そもそも対象が何かを明確に意識するということも大切です。何について議論しているのかが明らかでなければ、データの意義も評価しようがありません。

 

相対的な尺度

 安打を打つ確率、長打を打つ確率が高い打者は得点に有効です。3割30本といえば、「普通に考えれば」かなりの強打者でしょう。

 では何故3割30本は「普通に考えれば」かなりの強打者なのでしょうか。妙な問いに感じるかもしれませんが、実はここが評価の肝になる部分で、結局「普通」多くの打者はそれほどの打撃成績を収められないからです。

 仮に誰もが4割50本打っているリーグがあるとしたら、そこでの3割30本は評価に値するでしょうか。おそらくしないでしょう。

 並の打者に比べてよく打っている打者がいると相対的にチームが得点力アドバンテージを得られる(ひいては他のチームに比べて勝率が上がる)から勝利という目的が達せられる。そのときその打者は評価に値するのです。3割30本という数字に単独で価値が見出せるわけではありません。

 相対的に優劣を比較するということです。

 上で紹介した打撃得点も平均的な打者との比較になっています。比較の際の基準は色々考えられますが、伝統的には「リーグ平均」を用いるケースが多いです。繰り返しますがそもそもリーグの中で相対的に優勝を競っているからです。

 普段改めて言及されることは少ないですが、選手の有益性は相対的に計られるべきです。このことはセイバーメトリクスの数字を詰める際にはさらに積極的に意識しておきたい部分です。

 これは傑出度(Relativity)という考え方の歴史的評価にも通じます。傑出度とは異なる年度や異なるリーグの成績は単純比較できないため特定の範囲における相対的な優劣によって選手を評価する考え方です。

 例えば2003年頃などNPBが「飛ぶボール」を使っていたことが話題になりましたが、選手の成績はそのように環境の変化の影響を受けます。パ・リーグの打数あたりの本塁打率は2003~2007年で1%以上低下しましたが、この環境の変化に伴って打撃成績が落ちた選手に対して「能力が落ちた」という評価を下すのは必ずしも適切とは言えないでしょう。

 平均打率.240のときの3割打者と、平均打率.280のときの3割打者なら、前者のほうが傑出しています。リーグの中でそれぞれの持つ影響力は異なるはずです。

 そういった事情を考慮して、成績をリーグ平均で割ったり、リーグの得点の多さによる補正を加えたりすることが行われます。補正を行うことにより異なる年次・リーグの成績でも環境の中での相対的な利得というのは導き出せるし、それを比較することにより時代を超えて選手の貢献度を比較できるということです。

 

数字に表しにくいものなど

 よく言われるところに「流れ」だとか、チームの勢い、勝負強さといったものが数字に表れにくいということがあります。

 ただし従来合言葉のように言われた「数字に表れない働き」の範囲は研究が進むにつれて確実に狭くなってきています。対象がどのようなものであるか定義をして、厳密に統計を取れば多くの要素が結果に表れてくるからです。逆に、あらゆる研究をしても結果として数字に表れないとなると、ただ単に無意味なものである可能性も考えられます。

 例えばチームの気分が高揚する何かがあったとしてもそれにより実際にプレーに影響が出て勝利の見込みが高まらないのなら「試合には関係ないが気分が高揚した」だけの話であって貢献度として考慮する必然性はありません。

 セイバーメトリクスの基本的な指標では偶然性の排除ということもあり勝負強さの類は考慮されないことが多いです。最近では局面の影響力を測定した指標も多く、勝負強い選手は完全に無視はできない程度には存在するとされますが、検出される数字はかなり小さいものであり評価に決定的な影響を与えるものではありません。

 管理人の立場を言えば、「流れ」「勢い」「勝負強さ」といったものが特段の重要視に値するかには懐疑的です。そういったものが“明らかに”、“大きな影響力で”そこに存在しているなら色々と客観的な証拠として表れてもよさそうなものだと思いますが、これといって見たことがありません。最終的にどう考えるにしろ、根拠のない思い込みはしないように心がけたいところです。

 またセイバーメトリクスが精神力といったものを評価しないかと言えばそういうことはなく、むしろ対象とするデータに元々組み込まれているとみなされるものです。というのも試合に出場するプレッシャーに耐えられないような選手は解析の対象となる以前に淘汰されているもので、逆に強い精神力によって良い結果を残すことができる選手がいればそれは「良い結果」が評価されることで結果的に精神力も評価されるからです。

 

限定的な意味での相対的な正しさ

 このページではセイバーメトリクスは基本として対象がいかに勝利に有効であるかを対象の責任とみなせるデータから客観的かつ具体的に示す、ということを述べました。

 と説明するとなんだか偉そうですが、ここで

 セイバーメトリクスで野球のあらゆることが完璧に正しく評価できたり、未来の予測ができるか?

 と問われれば、答えはノーです。

 「数字に表しにくいもの」もありますし、記録は記録に過ぎず多くの偶然や他からの影響といったものも、排除しようとしても絶対に介入してしまいます。純粋な、完璧な評価というものは不可能です。またデータは全て過去のものであり未来は何が起こるかわかりません。

 ではセイバーメトリクスはくだらなく意味のないものでしょうか?

 これも答えはノーです。

 確かに、仮にこのページで紹介した打撃得点で言えば、ある年打撃得点が+30だった打者がいたとしても翌年も必ず+30だとか、そういう予想ができるわけではありません。しかし、四球や長打が得点に貢献することは論理的に明らかなだけでなくチームの総得点を予測する際に従来の打撃力評価のようにただ単に打率を用いたりするより打撃得点的な統計手法を用いて構築された指標のほうが遥かに正確だ、といったことはわかっています。そして打者それぞれの打撃得点にはそれなりの再現性(ある年高ければ次の年も高い、といった関係性)はあることも、チームの総得点が多いほど勝率が上がるという相関関係が強くあることもわかっています。

 であれば、チームの勝利を増やすためにどの打者を獲得すれば一番有効か、といった編成を考える上で打撃得点はひとつの指針になり得ます。そのような用途では、打率よりも打撃得点が「より正しい」わけです。

 正直であろうとするならば、「正しさ」に言及する際には“これこれこういう目的のときに”、“比較的”といった言葉は外せません。しかしそれこそが重要で、野球において意味のある用途で従来使われていたものさしよりも“比較的”有効であるものさしがあれば、それは意味のあることです。

 最初から数字を突き放していたらこのように有用な指標も生まれることはなかったと思います。数字に表れにくいものが随所にあることを認めたとしてもいくらかの表せる範囲もまた存在しますし、今後の探求によってさらなる範囲が出てくるかもしれません。従来20%しか明らかでなかったものが40%になればそれにはおおいに意味があります。「完璧かどうか」は特に問題ではなく、「何が明らかか」「比較的有用なものさしは何か」という見方が重要と言えます。

 最後に注意したいのは、ここで言及している「正しさ」というのは非常に狭い意味のものでしかない、ということです。

 そもそもセイバーメトリクスに興じることそれ自体が正しいかどうかといったことなどは答えの出しようがない(そして、考えても仕方がない)のではないかと思いますし、「セイバーメトリクスなんか知ったって楽しくも面白くもない」と言われればそれには何も言うことはありません。それはもはやサッカーが好きか将棋が好きかというのと同じ問題であり、個人の自由だからです。

 野球は数字なしで楽しむものだという立場も自由であれば、セイバーメトリクスを楽しむという立場も自由。ここではこれだけを言っておきたいと思います。

トップ > 基本的な考え方

ページのトップへ戻る
inserted by FC2 system