仮想的な数字と現実

2020.1.28

by Baseball Concrete

1.仮想的な数字への批判

 セイバーメトリクスの分析を支える基本的な考え方は、勝利は得点と失点によって決まり、したがって選手は得点と失点への寄与によって評価するというものです。例えば打者であればRCやLWTSによってどれだけ得点を創出したかで評価され、ピタゴラス勝率やRPWといった計算式によってそれが勝利への寄与という意味でどれだけの意味があるかに変換されます。

 そこで例えばRCが80であるというのは、ある意味仮想的(virtual)な数字です。ある打者のRCが80だといってもその打者の関与したところで実際に80回ホームベースが踏まれたかどうかはわかりませんし、チームのRCが600だとしても実際の得点数が600ちょうどであるとは限りません。

 このような意識からか、あるMLBのセイバーメトリクス系ウェブサイトに「大事なのは実際の、現実の得点や勝利だろ。お前らは理論上・仮想の得点や勝利の話ばかりしていてちゃんちゃらおかしいな」という趣旨のコメントがされているのを目にしました。

 もちろんいかにRCやピタゴラス勝率の値が高くても実際の試合の結果としての勝率が低ければ負けは負けですから、その限りでは意味がないとも言えます。一部を切り取った数字ばかり見ないでもっと実際の試合を見て複雑な現実と向き合えというのはセイバーメトリクスに対する批判で度々繰り返されるものです。

 ではこのような主張からするとセイバーメトリクスの指標は空疎で意味がないということになるのでしょうか。本稿ではこうした問題について少し考えてみたいと思います(「旧来の指標とセイバーメトリクス」の違う角度からの言い直しです)。

 

2.数字による単純化と感覚による単純化

 データ・数字で分析するというときに何をしているのか、あるいはデータを使わずに試合を観察するというときに何をしているかを情報処理の観点から少し分解して考えてみます。

 まず、現実世界には野球の試合に関係する無数の情報が存在します。その日の気温、投手の心拍数、ショートが使用しているグラブの皮の質、球場に来ている観客の数や声援の大きさ、打者のスイングスピード、打ってから走り出すまでの時間、審判の焦点、監督がその日の朝に食べたご飯……等々。これらは全て、我々が興味の対象としている野球の試合について関係がある(かもしれない)情報です。

 しかしこれら全ての情報を把握し処理することは不可能であり、データによって分析を行う際には例えば打者が打ったヒットの数や選んだ四球の数、盗塁の数、といったようにほんの一部の情報を恣意的に抽象化して切り取っていきます。この段階で、現実世界が持っている情報の99.999999%くらいは失われ物事は単純化されることになります。そして、そうして切り取った情報を指標の計算式に入れて、計算結果の値というアウトプットを得ます。簡単に言えば、これがデータによる分析の過程と言えるのではないでしょうか。

 これに対してデータを使わずに野球を見ることを考えると、「スイングが速いか」「変化球に対応して柔らかいスイングができているか」「(自分の見ている試合では)よくヒットを打っている」といった気になる部分について視覚・聴覚で情報を集め、記憶することになります。どういった点に着目するかは良くも悪くも恣意的ですし、また現実世界の情報のほんの少ししか切り取れないことはデータに頼る場合と同じです。記録をつける代わりに「この打者のスイングは鋭い」といったように自分の視覚と評価で抽象化・単純化を行うことになります。「この選手は要するに〇〇のようなタイプの打者だ」といった形で既存の情報に置き換えて現実を捨象する場合もよくあるでしょう。

 そしてそれらの情報を、指標の計算式を使う代わりに自らの脳内で「この打者は変化球に弱いが長打力は十分であり、ある程度の本塁打数は残せるだろう」といったように処理をして評価の結果というアウトプットを得ることになります。

 データを使った情報処理とデータを使わない情報処理を比べてみると、データは記録という一定の規則による単純化を、人間は視覚や聴覚と脳による単純化を行うと言えそうです。世界に存在する無数の情報から恣意的に一部を切り取るという点は同じであり、またその情報をどう処理するかという点についてはセイバーメトリクスではRCやWARといった計算式にインプットするのに対して感覚で考える際には各人の知覚・思考(おそらくは経験によって形成されたもの)で処理を行います。

 


(画像内イラスト出典:いらすとや

 

 こうして考えていくと「データによる分析は現実から離れた机上のもの」、「実際に試合を見るのは複雑な現実にきちんと向き合っている」といった区別は特に本質的な意味をなさないのではないかと感じます。どちらも複雑な現実から恣意的に情報を切り取って処理をしていることに変わりはないからです。問題はその情報処理によって「この選手はチームに貢献しているか」といった興味のある問いに対する適切な答えが出せるのかの中身であり、その中身に問題があるのであれば「データか感覚か」ではなく中身を論じれば足りる話です。

 セイバーメトリクスの大家Bill Jamesは「野球の統計は遥かに複雑な現実の単純化である。もっともこれは、全ての人間の理解はより複雑な現実の単純化にもとづくところからすれば、あえて言う必要もないのかもしれないが」と述べています(Bill James, The New Bill James Historical Baseball Abstract, (Free Press, 2003), p.338)。データのときは単純化していることがわかりやすいだけであって、感覚で扱えば単純化がなされないというわけではないでしょう。人間の視覚が捉えられるのは球場で起きていることの一部であり、またその限られた視覚情報すら、全て適切に記憶され処理されるわけではないのですから。

 セイバーメトリクスに批判的な人からすれば、データによる分析は、データを取得する際に大事な情報を見落としているのに気付いていなかったり計算において大事な要素を軽く扱っていたりすることがよくあると考えるのでしょう(あるいはセイバーメトリクス重視派からすればその逆)。しかしこれは「データに頼るから」「感覚に頼るから」という問題ではないように思われます。もちろん「データに頼るときはこういう要素を見落としやすい」「感覚に頼るときはこういう処理で偏りが生まれやすい」というクセのようなものはあるでしょうからそれぞれの特徴を把握することには大きな意味があるにせよ。

 明らかに両者で違いがあるのは、データや数字による単純化はその内容や過程が明示されやすく、後から他人でも確認でき、批判がしやすいことです。例えば「捕手のアベと遊撃手のサカモト、総合的にチームに貢献したのはどちらか」といった議題をデータと感覚それぞれで分析する場合を考えます。WARで計算するときは打撃成績に係数をあてはめて得点化したり、守備位置補正値を割り当てたりして評価を算出していきます。このとき守備位置補正の数字に経験則からしておかしく見える点があれば「WARは守備位置補正の数字がおかしいからダメな指標」などと批判されやすくなります(その「おかしい」という感覚が正しいのかどうかは別問題として存在しますが)。

 他方データや数字を使わずに同じ問題を考える場合でも、明示はされないだけで、「サカモトはよく出塁しているが、アベの試合を決める打撃の方がやはり重要だろう。一方で捕手は守備の要であるもののサカモトの守備範囲は素晴らしく……」といったように思いついた各種の要素に恣意的に重み付けをする情報処理プロセスがとられます。そもそも自然言語に解釈の幅がありますからこれについて明確にどこが間違っているという批判はしづらいですが、だからといって「正しい」ことになるわけではありません。

 特にWARのような貢献度を一元的に評価する指標は「何故もっと様々な要素を見て多角的に評価せずひとつの数字にまとめようとするのか」と批判されますが、年俸の評価をするような場面を考えれば感覚的な評価であっても最終的には選手をひとつの序列に並べなければなりません。WARが打撃成績や守備の処理結果の情報を網羅的に処理してひとつの序列を作るように、感覚により恣意的に情報を切り取って恣意的に重み付け・処理する過程を通じて「主観的なWAR」を組み上げることになります(恣意的だから間違っていると言っているのではありません)。ここでもやはり「ひとつの数字で見てはいけない」という批判は本質的ではないと考えます。「WARはファンが長年頭の中でやってきたことを客観的に行うものだ」という説明がなされるのも理解できるところです(Bobby Mueller, “Minor league baseball MLB free agency puts the “R” in WAR”)。ひとつの数字に落とし込むときのやり方が目的に対して適切かどうかの問題があるだけと言えます。

 「複雑な現実の一部を切り取って単純化した上で恣意的な処理を加えたものである」という点ではデータにもとづく分析もスカウティングも同じであって、実際の試合を見ているから複雑な現実にそのまま向き合えているとかデータだから机上の空論だとかいう議論は有益ではないはずです。

 

3.仮想と現実あるいは事実と実質

 仮想的な得点や勝利の話として始まったのでした。ここまでの議論を踏まえた上で、ヴァーチャルな数字について考えてみます。

 A投手がイニングの先頭打者に二塁打を打たれて降板し、次に登板したB投手がこれまた二塁打を生まれて守備側のチームに失点1が生じた場合を考えます。とりあえず公式の防御率の計算方法なんかは置いておくとして、この失点1はどちらの投手に割り当てるべきでしょうか。

 例えば「A投手に0.5失点、B投手に0.5失点」というような評価を考えると、「事実」を重視する立場からすればそれはヴァーチャルな失点であり、実際に0.5失点が生じることなどないのだからそういう現実離れしたものの見方はやめようという話になります。とはいえ仮にここで「こういう場合はA投手に1失点ということにしよう」と決めたとして、そのことにどういう意味があるのかという問題があります。上記のような場合でA投手とB投手のどちらかだけが失点を生み出したとする見方は物事の理解としてあまり有益ではないと考えますし、「事実として1失点が生じた」のはチームとして見ればそうですが、それを誰に割り当てるかというのは事実の問題ではなく評価(あるいは何が事実であるかの定義)の問題であり価値判断が介入します(このような批判は打点を前提としてColin Wyersが行っています。Colin Wyers , “What are little runs made of?”)。二人の投手の登板の結果としてひとつの失点が生まれたという現実に対して「A投手に1.0、B投手に0.0」というヴァーチャルな割り当てを行っているのです。同様に、RCが仮想の数字で打点が事実であるという議論にも本質的な意味はありません。物事を何のためにどう捉えるかの問題があるだけです。

 念のため言えばここでは主観的であるのが良いとか悪いとかいう議論は全くしていません。セイバーメトリクスを重視する人と感覚を重視する人で、野球に関する評論としてどちらが適切なことを言う傾向にあるのかもわかりません。セイバーメトリクスを重視しないほうが真理に近いのかもしれません。本稿の論点はセイバーメトリクスの指標は仮想の数字だから現実離れした机上の空論でダメ、実際に試合を見て現実に生じた結果を見ることこそ意味がある、というその議論の仕方は意味がないという点です。

 「ヴァーチャル」という言葉はゲームとか仮想空間といった連想に繋がりやすい側面もありますが、英語の辞書で引くと「(表面または名目上はそうでないが)事実上の、実質上の」という意味も出てきます(weblio)。名目的な事実に捉われないことでかえって各選手がどのような働きをしたかの実質に迫ることができ、あえて言えばセイバーメトリクスが打点を批判してRCを使うのはその意味でのヴァーチャルさを求めているからだと理解することができます。

 仮にXの打点が高くてもそれが前を打つYの出塁率の高さによるのであれば、多くの得点を生み出す実質はYにあります。誰に高い年俸を払って保持すべきか、他のチームが獲得を狙うならどちらが有効かなどを考える場合において「Xの打点が高いという事実」に注目しろと言ってもあまり意味がありません。

 「いやそういう場合はYがよく塁に出ているというその“事実”が重要なのだ。むしろそういった実態に気付くためにこそ表面的な数字だけを見るのではなく多角的な深い観察が必要だ」と言われるかもしれません。そこではもはや何が「事実」かは単なる言い方の問題に過ぎず、結局は打点という「現実の得点」から離れて「前の打者が平凡であればXの打点はもっと低かっただろう」「Yによってチームの得点はこれくらい増えているだろう」というヴァーチャルな評価を主観・感覚の世界で構築していることになるのであり、それらはRCの80点がヴァーチャルであるのと同様にヴァーチャルです。

 パークファクターなどによる補正に関しても、本塁打30本をパークファクターで割り引いて27.8本と計算すればその数字は現実から離れた机上の数字のように見えます。しかし数字を使わずに「この選手の本拠地球場は本塁打が出やすいから他の本拠地でプレーする場合より少し大きく出ているだろう」と実質を考えるのも同様に机上の計算です。

 セイバーメトリクスは、ある打者のチームの得点への貢献度がどれくらいかといった様々な問題について、現実世界をどのようにデータ化しどのように処理すれば(知りたい知見を得るという意味で)より実態を表すことができるかについて日々研究しているものであり、その中で打点という事実だけを見ていても打者の得点への貢献はわからないとしてRCやLWTSが生まれてきました。守備に関しては守備率への疑問から出発してデータの採り方そのものを見直し、UZRやトラッキングデータのようなものが出てきています。こうした分析が有意義かどうかは中身に対する評価次第であり押し付けはしませんが、「『セイバーメトリクスは仮想の数字だから意味がない』という批判には意味がない」とは思料するところです。

 

トップ > 分析・論考 > 仮想的な数字と現実

ページのトップへ戻る
inserted by FC2 system