もたらされた結果と真の能力

1.解釈の重要性

 指標を扱う際は「何を意味しているか」の理解がとても重要です。数字がアテになる・アテにならないの議論を時折目にしますが、数字自体に信頼性があるのではなく問題は解釈と使い方にあると考えていいでしょう。
 GDPを猫の体温を表すと考えれば間違っているに決まっていますし、かといってGDPで経済の全てがわかると考えるのもやはり間違っています。
 しかし、GDPは経済の動向を知る上でひとつの参考になります。どの指標にもある意味でのある程度の有用性が存在するのであって、“数字ばかりを頼りにするのは危険”といった「争点に直接関係ない一般論」で話が終わるのは乱暴ですし少々もったいない気がします。
 セイバーメトリクスの指標についても何かと議論が錯綜することがあるような気がするので、ここではこのサイトにおける管理人の考えを整理することを試みたいと思います。


2.選手個人と外的要因

 前提。ここでいうセイバーメトリクスはチームあるいは選手個人の働きを具体的かつ正確に表すことによって評価や戦力分析を行うことを目的とする……とします。
 そして、そもそも重要な点として確認しておきたいのは、野球はチームスポーツであり個人成績とされる記録でも大なり小なりチームメイトや相手の要因の偏りの影響を受けているということです。そのような、当該の選手以外で成績に影響を与えるものを外的要因と呼ぶことにします。
 セイバーメトリクスが否定している打点なども外的要因の影響が大きいことに問題があります。打撃内容が同じだとしても打席に立ったときの走者の数に左右されるというのは不公平です。
 それに対してRCやOPSのような指標は直接的に走者の数に左右されることがないため「比較的外的要因の影響が少ない」と考えられます。もちろん、影響がないとは言えません。完全な指標というのは存在しないのであって、比較的良い、ということしか言えません。ただしそれが重要なのです。80%的中する天気予報と90%的中する天気予報があると考えるならば、無論天気予報がないよりあるほうがいいし前者より後者が役に立つことは間違いありません。10%の外れがあるということはものさしとしての有用性を否定することにはなりません。
 つまり、成績には選手個人による働きと外的要因の作用が混ざって表れていて、それらをより区別する指標がセイバーメトリクス的な考えにおいては有用であるということ。例えば、打者個人の得点への貢献を評価するには打点よりもRCが優れていると考えます。


3.真の能力とは

 ではそれぞれの性格を何らかの言葉で表現するとして、打点は「結果・出来高」でRC・OPSは「能力」でしょうか? 私はそうは考えません。どちらも単なる結果であり、真の能力に迫っているかは別の話です。
 真の能力とはなんなのか定義が難しいところですが、統計学で言うところの母集団の平均、その結果を得る確率が最も高く十分な機会を与えればその範囲に収束するであろう値、と考えてみます。例えばある選手に10万打席打たせることが可能だとしてそれだけの機会数を積んだ後に残った打率はその選手の実力として叩き出すべき値に収束すると思われます。
 新人の年いきなりOPS.900を叩き出した打者がいて、彼が翌年以降全く打てなかったとしても、ルーキーイヤーにそれだけチームに貢献した評価は歪むものではありません。つまりOPSも結果か能力かの面ではただの結果であり、真の能力であるならまた繰り返せると考えるべきですがそれは考慮していないわけです。打点にしても「単なる結果である」ことが問題ではないわけで、「結果」と「能力」は根本的には対比させるものでもありません。
 結論を言うと、OPSのような場合「比較的外的要因の影響が少ない結果」であり、それは「当該選手の真の能力から得られた(割合が濃い)もの」と考えています。統計学の考え方を出したのでそのまま使いますと、母集団である能力に対して外的要因の影響を排除した指標は能力の標本と捉えています。もちろん、外的要因の影響を排除したほうが能力に迫るであろうことは言えますが、同じことのように表現するのは適当でないと考えます。

 A.選手に関するあらゆる結果
 B.外的要因の影響を排除した当該選手個人による結果
 C.当該選手の真の能力

 Aの中にBが含まれておりBはCから得られるもの、というのが私なりの整理です。このうちセイバーメトリクスの目的からして実用的なものはBまたはCですね。セイバーメトリクスの多くの指標が試みていることはAからB以外の範囲をなるべく除外(標準化)し野球の単位の評価を与えることで、この状態がRCなどの実利・出来高の評価にあたります。プロジェクション(成績予測)の評価や再現性の高い項目のみを基本としたDIPSなんかはCに迫ろうとしていると考えてもいいのかもしれません。
 概念を図にしてみたものが以下。


うわぁ……ひどい絵だどうしよう

 青の中が一応結果として目に見えるもので、青が強くなるほど外的要因によるバイアスの大きい、セイバーメトリクス的にはプアーなスタッツとなるでしょう。前述の外的要因の影響を排除する試みというのは図で言えば、青と黄色は混じってしまっているんだけれどもなるべく黄色いところを抽出しようということです。
 真の能力そのものはもちろん数字的には不可視ですが、バイアスを排除した(減らした)標本からある程度迫ることはできると考えられます。ただし、「バイアスの排除=真の能力の評価」とはならないと私は考えていることを繰り返し述べさせてもらいます。
 外的要因という言葉が合うかわかりませんが、選手の成績には何らかの一貫したバイアスだけでなく単純な運も含まれます。例えば式にすると

  結果としての成績=真の能力+バイアス+運による変動

 というふうに表すことができます。成績から真の能力のみを取り出すためには「数字の選別や補正によりバイアスを排除」し、「サンプル数を確保することで運による変動の排除する」。この二点が肝になるでしょう。


4.以上を踏まえて

 冒頭で触れた解釈の問題に話を戻すと、OPSはあくまで当該の選手による結果・実利であり、「選手本来の能力」であるように言ってしまうと少し話は違ってきてしまうと思います(選手の能力を表すものさしとして優れていないという意味ではありません)。
 その辺を踏まえた上で、これも繰り返しになりますが、外的要因の影響を減らして選手個人の利得や本来の能力に「より」迫っているならそれには意味(有用性)があります。周囲の状況の影響が大きい数字を使えば選手個人の力量に間違った評価を与えてしまうことになりかねませんし、運の大きい数字の再現を期待するのも危険です。外的要因の影響に配慮することで、これらの危険はある程度減ります。
 だからといってこれらの話は別に、外的要因の影響が大きい数字は存在価値がないとかそんなことには繋がりません。打点を稼ぐことこそ美しいと考えるのは個人の自由です。やはりどんな性格で何に適用すべき数字なのかを把握しておきそれに見合った利用の仕方(何に対して、どのくらい使えるのか)を考える、ということに尽きます。それこそがセイバーメトリクスという感もありますしそのことについて議論が分かれるから難しいわけですが、管理人の考え方は基本的に本稿で示した通りということです。




トップ > 四方山話 > もたらされた結果と真の能力

inserted by FC2 system