カテゴリー: 未分類

【野球】打撃指標の相関関係を調べたみた

野球を語るにセイバー指標を取り上げることが当たり前になってきた昨今だが、実際にセイバー指標はどの程度信頼できるのだろうかを確認したいため、よく使われている打撃指標について、各々が得点力といかに相関関係があるかを調べてみた。

 

データの対象としたのはセリーグ6チーム×6年(2011~2016年)。

36チームの年度毎の各指標とチーム総得点を調べ、それぞれを相関係数で表す。信頼出来る測定を行うにあたってサンプル数36では明らかに足りないが、大凡の関係性は分かるだろうと判断。調べんのめんどくさいし。

相関係数の詳細な算出方法については略とするが、共分散の積分したものを標準偏差の積で除するものである。この辺りは統計学。勉強したことって意外なところで生きてきたりするんだよね。まぁ今はCORRELの呪文を唱えたら後はExcelが全部やってくれる。便利。細かいことは分からん。

 

なお、各指標データを調べるにあたっては「プロ野球ヌルデータ置き場 様(http://lcom.sakura.ne.jp/NulData/index.html)」から参考とさせて頂きました。毎度お世話になっております。

 

それでは先に対象とした各指標について簡潔に記しておく。

・打率

・本塁打

・打点

 

・出塁率

=(安打 + 四球 + 死球) ÷打席数。

犠打犠飛を凡打として計算しているのでバントの多い選手は不利。

 

・長打率

=(短打×1+二塁打×2+三塁打×3+本塁打×4)÷打数

=(安打数×1+二塁打×1+三塁打×2+本塁打×3)÷打数

長打を打つ確率と勘違いしている人も少なくないが全く別物である。1打席における塁打数への期待値を表したもの。

 

・OPS

=出塁率+長打率

お手軽計算の割に信頼性の高い指標。

打者としての力量を測る上で最も使い勝手の良い指標である。

 

・GPA

=(1.8×出塁率)+長打率

OPSは出塁率の評価が低すぎるということで出塁率の比重を上げた修正版OPS。MLBではOPSより信頼性が高いとされる。

 

・RC

打者の得点能力を表した指標。単純な打撃成績だけでなく敬遠や走塁能力も加味されているためタイプの異なる選手のついても平等に比較出来る。

計算方法が若干ややこしいため計算式は割愛。ういきぺでいあさまによると(出塁能力 × 進塁能力)/ 出塁機会だって。ふーん。

 

・XR

計算式は異なるがコンセプトはRCと同じ。同じく計算式割愛。

短打とか二塁打とか三振とか凡打とか、各打撃結果の成績を細分化。それぞれ比重に応じた係数をかけ、全て足し合わせたもの。説明むずかしいから気になる人いたらぐぐってね。

 

 

それでは本題に入る。各指標について得点との相関係数をまとめて記す。

打率:0.724120

本塁打:0.849486

打点:0.997033

出塁率:0.832037

長打率:0.948757

OPS :0.970983

GPA :0.961410

RC :0.971851

XR :0.950752

 

調べていく上でまず驚かされたのがOPSの相関性の高さである。信頼に足る指標だと理解していたつもではあったが、走塁を考慮しておらず、計算式に理論的な裏付けが薄いこの指標が0.97という非常に高い数値を掲出するとは想像だにしていなかった。特に修正版OPSという位置付けであるGPA以上に1に近しい値になるいう結果はなんとも皮肉である。これについてはサンプル数を拡大し再度調査をしてみなければ正確なことは言えないが、元来MLBで開発された指標である故にNPBでは算出に用いる係数を再考する必要があるのかもしれない。勿論この程度の数字ならば誤差ということも十分に考えられる。

いずれにせよ、この結果だけを見ればOPSは得点力を測るのには十分な指標であることが示された。

 

次に出塁率に着目する。相関係数は0.83だが、これは打率の0.72に比べて15%以上も相関性が高いという結果である。個人タイトルのない出塁率重視の打者は年俸が高騰しないのでマネーボール型と呼ばれたりするが、選手を比較する上で打率と出塁率、どちらを重視するべきなのかは明白である。

ただ、出塁率は長打率に比べて劣っている指標であることも確認された。    GPAでは出塁率に重きを置いた指標であるが、この結果の限りではむしろ長打率に偏った計算をするべきなようだ。これについても範囲を拡大して再実験をしてみないことには解らないが、戦術として送りバントを多用する日本プロ野球ではMLBほど出塁率に信頼性がないのではないだろうか。原因は他にもあるだろうが、MLBでは相関性が高いとされているGPAは、こと日本においては判断の難しい指標になっているのは間違いなさそうだ。

 

最後に、今回最も相関性の高かったRCについて述べておく。

数値と結果を理論的に用いているだけにやはり相関係数は限りなく1に近い値となった。RCは打席数が多いほど高くなりやすいため、選手個々で比較するには打撃機会を均一化したRC27を用いるべきだが、これは非常に信頼性の高い指標であることが確認できた。また、同一チームであるならば、各選手がどれだけ攻撃面で貢献をしたか、という議論ではRCをそのまま用いればそれが信頼性の高い比較となるはずである。

 

 

野球はサッカーに比べて数字によるデータ分析が容易であり、現代のベースボールでは多種多様なデータ、指標が公開されている。データというのは第三者が一目で優劣が分かることが大事であるが、それを正確に判断するには指標の内容、測定方法の理解が不可欠である。今回の目的は正にその理解をすることだが、調べていく上で新たな発見をすることは少なくなかった。

私は理系分野先行ということもあってこのような数値比較は楽しくパソコンを叩けるのだが、数字の羅列を見るのが苦であるという人も勿論いると思う。だが野球に限らずあらゆるスポーツにおいて客観的な判別は大事なことだと思っているし、予備知識を持っていれば話の幅も広がると思う。

ただし、データや指標というものはあくまでも判断基準の1つとして扱うべきであって、数値で表せないもの、例えばスター性やリーダーシップなども全て含めて比較検討することが重要であることを忘れてはならない。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中