ビル・ジェイムズ(Bill James)という人物によって提唱された、野球についての客観的な知見の探求のこと。
アメリカ野球学会を意味するSABR(Sociaty for American Baseball Research)と指標や基準を意味するmetricsを組み合わせた造語。
当初はごく一部の野球好きの趣味として始まったが、徐々に分析に取り組む人が増えるとともに実際のメジャーリーグ運営に用いられるようになり、現在ではメジャーリーグの球団の多くがコンサルタント・アナリストを雇いセイバーメトリクスをチーム運営に活用している。
球場の特性が野球の試合に及ぼす影響、またはそれを特定の面について数値化したもの。
最もよく利用されるパークファクターは得点あるいは本塁打についてのもの。あるチームのA球場での「得点+失点」がその他の球場での「得点+失点」より1割多い場合、A球場の得点パークファクターは1.100となる。1.000を標準として、1より大きければ得点(または本塁打やその他対象の項目)が記録されやすい球場であり、1を下回っていれば得点が記録されにくい球場であることを意味する。
異なる環境下でプレーする選手同士を比較するために指標の補正等に使用される。
この数字は概念的にはプレーするチームの特性に影響されることはなく、例えば貧打のチームがプレーしているからといって得点のパークファクターが低く出るわけではない。
《計算式》※得点パークファクターの場合
(本拠地球場での試合あたり得点+失点)÷(他球場での試合あたり得点+失点)
関連ページ:パークファクター
マイケル・ルイスが著した小説で、メジャーリーグのオークランド・アスレチックスが乏しい資金力ながらセイバーメトリクスを用いた先進的な選手評価で効率的に多くの勝利を稼ぐ様子や、それにまつわる人々の人間ドラマを記したノンフィクション。
出塁率の重要性、犠打と盗塁の価値のなさ、DIPSによる投手評価などセイバーメトリクスの重要な考え方が多く書かれており、そして何よりセイバーメトリクスがプロ野球の現場で活躍すること、これまで脚光を浴びなかった「本当は優れた選手」がセイバーメトリクスにより注目され活躍する姿が感動的に描かれている。後にブラッド・ピット主演で映画化された。
特定のアウトカウント・走者状況から、そのイニングが終了するまでに平均的に何得点が見込まれるかを表す数値。
アウトカウントは無死・一死・二死の3種類、走者状況は無走者・一塁・二塁・三塁・一二塁・一三塁・二三塁・満塁の8種類あり、あり得る組み合わせは3×8=24種類存在する。その24種類について得点期待値を算出してまとめたものは得点期待値表と呼ばれる。
2013~2015年のNPBの得点期待値表は以下。
走者\アウト | 無死 | 一死 | 二死 |
走者無し | .440 | .233 | .087 |
一塁 | .807 | .478 | .204 |
二塁 | 1.059 | .682 | .305 |
三塁 | 1.291 | .906 | .349 |
一二塁 | 1.412 | .878 | .417 |
一三塁 | 1.684 | 1.165 | .495 |
二三塁 | 1.888 | 1.321 | .578 |
満塁 | 2.092 | 1.454 | .758 |
(出典:1.02 Essence of Baseball Glossary「得点期待値/得点価値」)
アウトカウント・走者状況(あるいは点数)に変動をもたらすグラウンド上の事象であれば状況の変化を得点期待値表にあてはめて「その事象が起きる前の状況における得点期待値」と「その事象が起きた後の状況における得点期待値」を比較することでその事象が得点(失点)の増減においてどれだけの影響があるかを定量的に計測することができる。
例えば上記の得点期待値表において無死走者なし(得点期待値.440)からヒットを打つことは状況を無死一塁(得点期待値.807)に変化させ、その差で.367だけ得点の見込みを高めたことになる。バントであれ盗塁であれ敬遠であれあらゆる事象にあてはめることができ、得点期待値表による分析は戦術の考察から選手の評価まで非常に幅広い応用範囲がある。例えばBRなどは得点期待値から派生する指標の代表例。
この値はあくまでも平均値であり、個々の場面でプレーしている選手の能力によっては必ずしも平均的な見込みがあてはまるわけではないことには注意が必要。また当然、集計の対象とする年度・リーグごとに数値は微妙に異なる。
ジョージ・リンゼイ、ピート・パーマーらが開発した各種の事象に一定の価値を加重する分析・評価方式。線形加重。
基本的にLWTSは得点期待値と関連している。例えばBRはLWTSの打撃評価であり、打撃のイベントごとに平均的な得点期待値の変化を価値として付与する。あるいは、回帰分析を由来とするがXRも同類の方式と言える。
LWTSを用いた評価は内容がわかりやすく算出も容易であり、それでありながら多くの場合で十分に正確な評価を可能とするため広く利用される。
ただし「野球は線形ではない」という批判は存在する。四球が増えれば塁上の走者が増えるため安打などの価値も上がるといったように野球のそれぞれの出来事は相互依存的に影響し合っており、また投打の力関係が変われば全体の傾向も変わってくるため、BRやXRが示すように各事象がそれぞれに独立した一定の価値を持っているわけではない。事象の相互関係を考慮に入れた非線形のモデルとしてはBsRやRCが挙げられる。
関連ページ:打撃総合指標について
リプレイスメント・レベル (Replacement Level)
選手の価値を評価する際に基準として用いられる水準。いくつかの定義が存在するが一般的に、レギュラーの選手が怪我をした場合に余計なコストを支払わずに用意することができる代替選手の能力水準のことをいう。
MLBの算定ではリプレイスメント・レベルの選手でチームを構成した場合得点率は平均の80%程度、失点率は平均の120%程度、勝率は.300程度となる。
関連ページ:リプレイスメント・レベル概論
打数のうちの安打の割合。
一般的には打撃の指標として最も浸透しているが、セイバーメトリクスにより有用性の低さが指摘されている。
打率を打者の得点力を表す指標として使うには(1)四死球を無視している(2)長打を評価しない、という大きなふたつの問題があり、得点との相関関係の強さは出塁率、長打率のいずれにも劣る。
《計算式》
打率=安打÷打数
犠打・インターフェアを除く打席のうち、アウトにならず出塁した割合を表す指標。
出塁し進塁することにより得点を上げる野球という競技においては出塁率は根本的な必要条件となる数字。また、マネー・ボールに描かれたアスレチックスが過小評価されている選手獲得の指標として重視したことから特に注目された。
平均は.330前後。.400を越えればリーグ最高レベル。
《計算式》
出塁率=(安打+四球+死球)÷(打数+四球+死球+犠飛)
派生:OPS
1打数あたり平均していくつの塁打を得たかを表す指標。
塁打とは「1×単打+2×二塁打+3×三塁打+4×本塁打」で、打者が進む塁の数で加重した安打数と言える。安打が全て単打の場合、長打率は打率に等しくなる。長打のみを考慮しているわけではない。
平均は.400前後。.600を越えればリーグ最高レベル。
《計算式》
長打率=塁打÷打数
派生:OPS
打者が打席あたりで得点増加に有効な打撃をしているかどうかを表す指標。数値が高いほどチームの得点増加に貢献している打者だと評価できる。
出塁率と長打率を足すだけで簡単に求められるわりに得点との相関関係が非常に強いことが特徴で、近年ではコアなセイバーメトリクス好きだけではなく一般的なメディアにおいても広く利用されている。
四死球・単打・二塁打・三塁打・本塁打それぞれの加重バランスがXRなど統計的に合理性のある指標と近似性を持つ。
平均は.730前後。.1000を越えればリーグ最高レベル。
《計算式》
OPS=長打率+出塁率
関連ページ:得点力評価の前提
打者が創出した総得点。
RCが50ならその打者が得点50を生み出したということであり、チームとしてのRCは実総得点と近しくなる。
打席数が多いほど多くのRCを稼ぐ機会が与えられていることになるので同じような機会数を仮定して得点創出の生産性を複数の選手間で比較する場合はRCを打席数やアウト数で割る必要がある。
『マネー・ボール』で紹介された得点公式「(安打+四球)×塁打÷(打数+四球)」はRCのBasicバージョンであり、簡単には出塁率×塁打でも求められる。
2002年バージョンは以下。
関連ページ:打撃総合指標について・得点力評価の前提・偉大なるRuns Created
(計算方法は全く異なるものの大まかな意味としてはRCと同じ)
打者が創出した総得点。
XRが50ならその打者が得点50を生み出したということであり、チームとしてのXRは実総得点と近しくなる。
打席数が多いほど多くのXRを稼ぐ機会が与えられていることになるので同じような機会数を仮定して得点創出の生産性を複数の選手間で比較する場合はXRを打席数やアウト数で割る必要がある。
なお、フルバージョンから多少簡易的なものまで主に3種類バリエーションが存在する。
《計算式》
XR = 0.50×(安打-二塁打-三塁打-本塁打)+0.72×二塁打+1.04×三塁打+1.44×本塁打
+0.34×(四球-故意四球+死球)+0.25×故意四球+0.18×盗塁-0.32×盗塁死
-0.09×(打数-安打-三振)-0.098×三振-0.37×併殺打+0.37×犠飛+0.04×犠打
XRR(Extrapolated Runs Reduced) = 0.50×(安打-二塁打-三塁打-本塁打)+0.72×二塁打+1.04×三塁打+1.44×本塁打
+0.33×(四球+死球)+0.18×盗塁-0.32×盗塁死-0.098×(打数-安打)
XRB(Extrapolated Runs Basic) = 0.50×(安打-二塁打-三塁打-本塁打)+0.72×二塁打+1.04×三塁打+1.44×本塁打
+0.34×四球+0.18×盗塁-0.32×盗塁死-0.096×(打数-安打)
関連ページ:打撃総合指標について・得点力評価の前提
RCAA (Runs Created Above Average)
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したか。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
RCAAが+5の打者がいた場合、もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう、という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したか。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
XR+が+5の打者がいた場合、もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう、という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したか。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
BRが+5の打者がいた場合、もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう、という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
ここではピート・パーマー(Pete Palmer)が整理した指標を指すが、Batting Runsという用語自体は広義なものとして全く異なる計算法で導き出された値にも利用されることはある。また、近年はリプレイスメント・レベル(代替可能な水準)と比較してのBRAR(Batting Runs Above Replacement)という指標もあり、それと対比・区別する意味でBRAA(Batting Runs Above Average)と表記されることもあるが、意味としては同じ。
関連ページ:打撃総合指標について
David Smythにより開発された得点推定式。対象の打撃成績から何得点が期待されるかを出力する、RCと同様の役割の指標。
式は「出塁走者数×出塁した走者が得点する確率+本塁打」という形で、打者が出塁し出塁と進塁が集中していくほどに走者が生還し本塁打は本塁打の分絶対的に点が入るという野球の構造を考慮した論理的な組成となっている。
チームの総得点を予測する精度が非常に高いことで知られるが、打線の得点環境を考慮する乗算モデルであるため打者個人の得点創出の算出に使うには補正が必要。
類似:RC
関連ページ:打撃総合指標について・得点力評価の前提
RC27 (Runs Created per 27 outs)
ある打者が一人で打線を組んだ場合の1試合(27アウト)あたりの得点数。
アウトにならない間にいかに得点数を稼ぐかという野球の形式が表されており、アウト数で標準化されているので出場数の異なる複数の打者の得点創出能力を比較するような場合RCの値そのままよりもこちらのほうが適切。
類似:XR27
XR27 (eXtrapolated Runs per 27 outs)
ある打者が一人で打線を組んだ場合の1試合(27アウト)あたりの得点数。
アウトにならない間にいかに得点数を稼ぐかという野球の形式が表されており、アウト数で標準化されているので出場数の異なる複数の打者の得点創出能力を比較するような場合XRの値そのままよりもこちらのほうが適切。
類似:RC27
打者の長打力を表す指標。
安打を打つ確率が低くても長打が多ければある程度高く出るので打者としての総合的な優劣ではなく長打力だけを浮き上がらせる目的で使用される。
安打が全てシングルヒットの場合は0になる。平均は.130程度。
四死球での出塁の多さを表す指標。
安打による出塁の分は減算されるため、打者の総合的な貢献の高さを表す指標ではなくタイプを表す指標。
平均は.060程度。
BABIP (Batting Average on Balls In Play)
本塁打を除くインプレー打球が安打になった割合。
ボロス・マクラッケンは投手の被BABIPが年度ごとに極めて不安定で一貫性がなく、長期的に見ればどの投手も同じような水準に落ち着くことから、投手の能力で(本塁打以外の)ヒットを防ぐことはできないとするDIPSの理論を提唱した。
投手に比べれば打者では選手ごとに多少差がつく傾向にはあるがそれでも一貫性は弱く、「バットコントロールが巧みでしぶとく野手の間を抜く」などの技術の存在を認める旧来の常識と異なるため、セイバーメトリクスにおいては何かとキーワードになる。
BABIPを3割とするとそれを1から引いた残りの7割は打球を守備がアウトにした割合であり、これはDERという名称でチームの守備の指標として利用される。
類似:DER
wOBA (Weighted On Base Average)
打者が打席あたりにどれだけチームの得点増に貢献する打撃をしているかを評価する指標。加重出塁率。MLBの代表的なデータサイトであるFanGraphsやBaseball Referenceで打者の評価に利用されておりセイバーメトリクスの打撃評価指標としては最もポピュラー。
LWTSの原理に基づいて各種の打撃結果に重みを与え打席数で割ることで計算される。
出塁の価値を全て均一とみなす出塁率よりも打撃の貢献を総合的に表し、加重が統計的な根拠に基づいていることからOPSよりも適切に打撃の価値を評価する。
数字のスケールは出塁率に合うように設計されているため、平均的な打者で.330程度になる。
関連ページ:イチからわかるwOBAのすべて
wRAA (Weighted Runs Above Average)
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したか。wOBAに基づいて計算される。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
wRAAが+5の打者がいた場合、もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう、という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
関連ページ:イチからわかるwOBAのすべて
打者が創出した得点数。
数値が高いほどチームに多くの得点をもたらしており貢献している打者だと言える。
打席数が多いほど多くのwRCを稼ぐ機会が与えられていることになるため単純に生産性の比較はできない。
打席あたりの貢献の高さはwOBAで、平均的な打者と比較してどれだけ利得をもたらしたかはwRAAで評価する。
関連ページ:イチからわかるwOBAのすべて
RSAA (Runs Saved Above Average)
同じイニング数を平均的な投手が投げる場合に比べてどれだけ失点を防いだか。
ある投手が100イニングを40失点で投げきったとする。このときイニングあたりの失点のリーグ平均が0.5であれば100イニングに通常見込まれる失点は50であるので、その投手は平均より失点を10点少なく抑えたことになり、それがまさにRSAAの値となる。
失点率がリーグ平均より悪い投手はマイナスの値となる。RSAAの計算を失点率ではなく防御率で行うとPitching Runsという指標になり、これらはwRAA、BR、RCAA、XR+の投手版とも言える。
注意点として失点率は野手の守備力にも依存する数字であり、投手に関して守備から独立した評価を重視する現代のセイバーメトリクスにおいてRSAAが用いられる場面は非常に少なくなっている。
WHIP (Walks plus Hits per Innings Pitched)
イニングあたりにどれだけ走者を許したかを表す指標。
標準は1.20~1.40程度で、数値が低いほど走者を出さず安定した投球をしたと評価される。
走者の引継ぎの問題などで先発に比べて防御率による評価がしにくい救援投手の評価に比較的有効という見方もあるが、被安打は野手の守備にも大きく左右され純粋な投手の働きを表す指標ではないため現代的なセイバーメトリクスにおいては指標としての有効性が強く疑問視されており、基本的には使う必要のない指標。
関連ページ:WHIPの解釈と応用
DIPS (Defense Independent Pitching Stats)
守備から独立した投手数値。
「ホームラン以外のフェア打球は、ヒットになろうとなるまいと、投手には無関係なのではないか?」というボロス・マクラッケン(Voros McCracken)が発見した理論に基づき、本塁打以外の被安打は平準化した形で投手の各種数値を補正する。
DIPSには派生的な計算方法が多数存在し、よく利用される簡便な計算法としてはトム・タンゴ(Tom Tango)のFIPがある。
DIPSの理論は急進的であり従来の常識に反していたことから発表当時大きな批判にさらされたが現在ではその有効性が認められている。
FIP (Fielding Independent Pitching)
DIPSの理論に基づき、守備に依存しない被本塁打・与四球・奪三振から「守備から独立した防御率」を評価する指標。トム・タンゴ(Tom Tango)考案。
それぞれのイベントに対する加重は得点価値に基づいている。
DER (Defense Efficiency Ratio)
チームが打たれた本塁打を除く打球について、野手がそのうち何割をアウトにしたかを表す、チーム守備力の指標。
DERが高ければチームは相手の打球を安打にすることを許さず、よく出塁を防いだということになる。
標準は概ね7割前後。BABIPとは表裏一体の関係にあり、本塁打以外の打球のうち「安打になった」割合を表すのがBABIP、「安打にならなかった」割合を表すのがDER。
類似:BABIP
守備者の9イニングあたりのアウト関与数。多いほど守備範囲が広く優秀な守備者とされる。レンジファクター。
通常同守備位置内での比較に使う。例えば、一試合に平均4.2個のアウトを奪う遊撃手と5.1個のアウトを奪う遊撃手では後者のほうが優秀であると考えられる。
従来使用されてきた守備率と異なり積極的なアウト獲得を評価する。
なお、日本においては現状RFの算出に必要な守備イニング数のデータが公的に手に入らないという問題がある。
派生:RRF
関連ページ:守備指標の話 RFとRRF
RFの改良版。
従来のRFに対し指摘されていた、投手の奪三振率による偏り、投手のゴロ/フライ傾向による偏り、左投手/右投手の投球回数割合による偏り、チーム守備力の影響、等についての補正を行っている。
同じ守備位置のリーグ平均の選手に比べて何倍の能率でアウトを奪ったか、またリーグ平均の選手が同じ分出場するのに比べていくつ多くアウトを奪ったか(=Plus Plays)という数字にして出力される。
関連用語:RF
関連ページ:守備指標の話 RFとRRF・ゾーンシステムとレンジシステム
責任範囲に飛んできた打球のうちどれだけの割合をアウトにしたかで野手の守備を評価する指標。
守備者の責任となる打球のカウントは映像を基にひとつひとつ人間の目で行われているもので、大雑把な推定でノイズを多く含むRFに比べて信頼がおかれている。
基礎データの相違も含め複数のバージョンが存在するが、ひとつの例としてMLBに関しては書籍『The Fielding Bible』でゾーンレイティングを改良したリバイズドゾーンレイティング(Revised Zone Rating)を公開している。
開発者であるジョン・デュワン(John Dewan)は(リバイズド)ゾーンレイティングはDRSより簡単な指標であるもののまた違う視点を提供するのに有用であると言及している。
派生:UZR・プラスマイナスシステム
関連ページ:ゾーンシステムとレンジシステム
同じ守備機会を、同じ守備位置の平均的な野手が守る場合に比べてどれだけ失点を防いだかを表す守備の指標。ゾーンレイティングをさらに進化させ、打球の位置や種類、速度ごとにサンプルを細分化した上で計算される。
通常の守備者が20%しか処理できないような打球を処理した場合20%を100%にした差分0.8を「平均的な守備者に比べ多く獲得したアウト(plus)」として記録し、処理できなかった場合0.2を「平均的な守備者に比べ獲得できなかったアウト(minus)」として記録するような方式をとっている。それらのアウト評価を得点に換算して集計した数字の合計が守備者のUZRとなる。内野手はゴロの打球のみが評価の対象。
ただし最終的な結果には打球の処理だけでなく、内野手であれば併殺の処理、外野手であれば送球による相手走者の進塁阻止なども評価される。
MLBの選手についてのUZRはFanGraphsで、NPBについては1.02 Essence of Baseballにて公開されている。
類似:DRS
関連ページ:ゾーンシステムとレンジシステム
同じ守備機会を、同じ守備位置の平均的な野手が守る場合に比べてどれだけ失点を防いだかを表す守備の指標。基本的にはUZRと同じ。
ただしUZRとは算出機関が異なり、データの集計方法や計算方法に細かい相違がある。
類似:UZR
関連ページ:ゾーンシステムとレンジシステム
ピタゴラス勝率 (Pythagorean winning percentage)
チームの総得点と総失点から見込まれる勝率を導き出す式。ビル・ジェイムズ考案。
勝利と敗北の比は得点と失点の比の二乗に比例するという統計的な法則を表している。
細かい改変バージョンが多数存在する。名称は式の形が「ピタゴラスの定理(a^2+b^2=c^2)」を思い起こさせるところから来ているとか。
関連用語:RPW
関連ページ:得点を勝利に換算する
チームの勝利をひとつ増やすのに値する得点数。
一般的にはRPWは10であり、それはすなわち得点が10点増えれば(あるいは失点が10点減れば)チーム勝利が1つ増えるという「得点数と勝利数の間の対応関係」があることを意味する。RPWがわかれば得点数で測定された数値を勝利数に変換することができる(あるいはその逆)。
ただし年度やリーグごとに平均得点数が異なり、得点の多いリーグでは1得点あたりの勝利への影響度が下がるため、常に「10点で1勝」と考えるのは適切ではない。そこでピート・パーマー(Pete Palmer)は得点環境に対してRPWを計算する式を開発している。パーマーの計算式はイニングあたりの両チームの得点の平方根をとり10倍するというもの。
それ以外にも求めるための方法は複数あるが、プロ野球ではほぼ9~11の範囲におさまることから、一般的には「10点で1勝」が基本の原則として認識されている(パーマーの手法では平均得点が4.5のときRPW=10となる)。
例えばBRをRPWで割れば打者が増やした勝利数(Batting Wins)が求められ、70勝70敗のチームが平均的な打者をBatting Wins +1の打者に取り替えた場合勝敗は71勝69敗になる計算。
関連用語:ピタゴラス勝率
関連ページ:得点を勝利に換算する
選手の総合的な貢献度を表す指標。選手が貢献した勝利数の3倍という形式で表される。すなわち、7勝分の貢献をした選手のWSは21。
Win Shares(Win=勝利 Share=取り分)の名の通り、貢献の割合に応じてチームの勝利数を各選手に分配するという方法をとっている。打撃・投球・守備をまとめて評価しているため、あらゆる選手を同一の土俵で並べられるのが最大の特徴。
結果的な貢献度を評価することを重視しており、MVP選定や殿堂入りの是非など事後における実績の評価の際に活用されることが多い。
算出方法は、開発者のビル・ジェイムズ自身が欠点だと認めているほど複雑で、指標と同名の書籍に収められている。
選手の打撃・走塁・守備・投球における貢献度を総合的に評価し、一元的な数値で表す指標。
評価は同じ出場機会分をリプレイスメント・レベルの選手が出場する場合に比べてどれだけチームの勝利を増やしたかという形で表される。
いくつかのメソッドが発表されているが一般的な枠組みは「攻撃評価+守備評価+守備位置補正+投球評価+代替水準対比価値」となる。
FanGraphsのWARでは、打撃はwOBA、守備はUZR、投球はFIPに基づいて評価される。
いくつかのデータの数値を合計し個数で割ったもの。複数の数値を代表してそれらの数値の「中心」がどこにあるかをひとつの値で表す。
平均にも複数種類があるが特に断りなく「平均」と言えば普通は上記の方法で求める算術平均のこと。
仮に人間3人の年齢についてのデータに注目した場合でAさん26歳・Bさん32歳・Cさん23歳なら平均年齢は27となる。
複数の数値の傾向をまとめる際頻繁に利用されるが、単に数理上の値である(例えばここの例でも27歳の人間というのは存在しない)ことや高い低いに関わらず大きく外れた値があると分布の中心から離れてその方向に引っ張られることに注意が必要。
データの中心を表すために使用される統計には他に中央値、最頻値がある。
いくつかの数値について、それらがどれだけ平均から散らばって分布しているかを表す。
標準偏差の値が大きければばらつきが大きく、小さければばらつきが小さくデータが平均値付近に集まっていることになる。
例:先発野手9人の打率が以下だとする。
0.280 0.275 0.312 0.330 0.267 0.248 0.288 0.231 0.244
打率の平均は0.275であり、各打者の平均との差(偏差)は以下になる。
0.005 0.000 0.037 0.055 -0.008 -0.027 0.013 -0.044 -0.031
標準偏差はこの「平均からの離れ具合」の平均をとりたいわけだが、このまま平均すると正負が打ち消しあいゼロになるので、それぞれの値を2乗して平均する(これは分散という統計値)。最後に、単位が2乗されてしまっているので分散の正の平方根をとると、標準偏差となる。
ここでは標準偏差は0.030であり、各打者の平均打率からの離れ具合は標準的に0.030であると言える。
データの散らばり具合を表す分散及び標準偏差は統計学では平均と同レベルで重要視される。
ふたつのデータについて、片方が増えるとき他方も増えるという関係のこと。
例えば多くの安打を放つほど出塁と進塁が多くなり得点が増えることから、打率と得点率の間には相関関係がある。
データ間の相関関係の強さは、相関係数という指標により客観的に測定することができる。相関係数は1に近いほど相関関係が強いことを表し、0に近いほど相関関係がないことを表す。またマイナスの値は負の相関関係(片方が増えれば他方が減る)を意味する。
相関関係があるからといってそれが必ずしも因果関係があることを意味するわけではないことには注意が必要。
相関係数を2乗すると決定係数と呼ばれる統計数値となり、決定係数は片方の変動が他方の変動により何パーセント説明できるかを表す。