野球データ分析における新時代の幕開け

『Baseball Geeks』で 野球談義に変化を!

Baseball Geeksでは、mlb.comで公開されている baseballsavant や、Baseball Prospectus のデータを用いて、投手や打者を分析し、その結果の一部を公表していきます。

セイバーメトリクスのデータによって選手評価や予測をしているサイトはいくつかありますが、Baseball Geeksでは、スポーツ科学を専攻してきたGeek(オタク)達が、これらデータを用いて、統計学ではない視点から分析する点が特徴となっています。

上記サイトで紹介したデータは、だれもが入手できるものです。しかし、この情報は解釈しやすいものとは言えません。例えば、投球されたボールの変化した量がアクセスできる状態にあります。

このデータによって、いわゆるボールのキレとかノビなどが表現できます。ダルビッシュ投手の4シームが何センチホップし、何センチシュートしているのかがわかります。

しかし、この解釈には物理学の知識が多少必要になります。「すごく面白いのに、流行らない」と私は常に思ってきました。Baseball Geeksでは、この指標の解釈にも踏み込み、「良いボールって何?」という視点から切り込んでいきたいと思っています。

Geekが増殖して、「昨日投げたマエケンの4シームのホップ成分は50cm超えてたぜ!」のような野球談義が居酒屋で起こることを期待しています。

必要不可欠なビジネスでのデータ活用

ビジネスの世界では、データを加工して得た情報をさらに精査して、意思決定者のニーズに沿った価値ある判断材料を取り出すことが必要です。

これら手法や技術をビジネスインテリジェンスと呼び、重要なビジネス上の出来事について客観的かつ深く理解できるようになりました。

野球においても、1970年代にセイバーメトリクスが提唱され、監督や球団オーナーなどの意思決定者のニーズに対して統計学的なインテリジェンスが提供されてきました。

データの分析者に求められるスキル

近年のテクノロジーの進歩によって入手できるデータが飛躍的に増えています。野球場に設置されたカメラやレーダーによって、起こることすべてが3次元で記録できる時代になってきています。

 

これまで扱ってきた統計学的な評価指標に加えて、物理学的な情報も含まれるようになりました。

テクノロジーの進歩によって統計学では予測がしにくい対象にまで言及できるようになってきています。

野球の統計データがもっとも役立つのはメジャーリーグで、下位のリーグへ降りていくほど有効性が薄れていく

とアメリカの統計学者ネイト・シルバー氏は述べています。

つまり、統計学は、過去の成績の延長線上に予測を位置づけるため、若い選手やアマチュアの選手のようにデータが少なかったり、偏りがある場合は予測することが難しくなります。

一方、物理学的なデータは、この点においてはサンプルが少なくても選手を評価することができます。

例えば、近年ボールの変化の大きさを定量化することができるようになりました。打ち取る能力の高い投手のボールの変化の大きさがわかっていれば、いくらサンプルが少なくても「○○投手くらいの奪空振率を残す可能性がある」と未来を予測することができます。

このように統計学が重要視されつつある野球界において、MLBの球団で雇用されているアナリストは、統計学、機械学習、プログラミングの知識を持った人がほとんどでした。

近年の動向としては、物理学を専攻した人が球団に採用されています。NASA(アメリカ航空宇宙局)の研究員がMLBのあるチームに採用されたという話もあるくらいです。

つまり、テクノロジーの進歩によって採取できるデータの種類が変化しており、それに伴って野球のデータを扱う人に求められるスキルも変化してきているということです。

トレーニングに繋がるアナリティクス

バブソン大学経営・情報テクノロジー特別教授のトーマス・H・ダベンポート氏は「アナリティクス3.0」の中で3つのアナリティクスの種類について述べています。

過去について報告する説明的アナリティクス、過去のデータに基づくモデルを使って将来を予想する予測的アナリティクス、最適な行動や活動を特定するのにモデルを使用する指示的アナリティクスです。

「アナリティクス3.0」では、指示的アナリティクスが特に重視されます。単に未来を予想するだけでなく、どのような行動をとるのが望ましいかまでを明らかにする分析の価値が高まっています。

アナリティクス3.0を野球に置き換えると以下のようになります。

説明的アナリティクス

過去のデータを用いて選手を評価します。ここはセイバーメトリクスの出番でしょう。

予測的アナリティクス

運の要素が少ない指標を扱ったり、選手の実力が年齢とともにどう変化するか(エイジングカーブ)を理解することで、将来的に選手がどうなるかを予測していきます。

指示的アナリティクス

目標とする指標に対して、どのようなトレーニングを行うことでそれが達成されるのかまで提案できる分析を行います。例えば、OPS(出塁率+長打率)という指標ですが、得点を奪う能力を表す重要な指標であるということは分かっています。
では、この指標がどのようにして向上するのかは今のところ分かっていません。これからは、トレーニングにまで言及できるような分析が必要ということです。
この領域は、統計学ではなく、運動生理学やバイオメカニクス、栄養学などスポーツ科学分野が守備範囲になってくるのかもしれません。

目新しいデータに関わる姿勢

あなたが予測者として優秀であるかどうかは、情報を多く手にするほど予測が当たるようになるかによってわかる。情報が増えたのに予測の的中率が下がるようなら、あなたの姿勢に問題がある。

これもネイト・シルバーの言葉です。

これからの野球のデータ分析は、確実にこれまでとは違った、新しい情報が入手できる時代になります。これら新しい情報を正しくインプットできる能力は、選手評価や新しい予測モデルの構築、さらにはテーラーメイド型のトレーニングの提案などのアウトプットに大きく関わります。

ここで言う「正しくインプットできる能力」は、ただ知識を増やすだけではありません。新しい情報を使ったデータ分析によって、これまで経験的に語られていた事象とは正反対の理論や、考え方が出てくることが予想されます。

今までの考え方を捨てて、新しい情報にアップデートする必要もあるということです。

ネイト・シルバーは、こんなことも述べています。

新しい情報に接したとき、どのように反応するか。状況の変化に腹をたてて、過剰に反応するか。あるいは予測が外れそうな事実に直面したとき、冷静に考えを変えることができるか。

新しいデータを扱う者の姿勢としては、心にとめておきたい言葉です。

プロだけじゃない!アマチュア野球にも拡がりを見せるデータ分析

データ活用の波はアマチュア野球界にも訪れようとしています。先ほど取り上げたボールの変化量ですが、これを計測できる簡易型のトラッキングシステムがアメリカでは発売されており、日本でも近々発売予定です。

また、ボールにセンサーが埋め込まれたトレーニングボールも発売が予定されており、同様のデータを取得できます。

Baseball Geeksでは、今後拡がるアマチュア野球でのデータ活用に先駆けて、トレーニングの指針となるべきデータを公開し、ある意味教育的な側面も担っていきたいと考えています。

本サイトが野球界の発展の一助となれば幸いです。

次回からは具体的な数字を挙げてテキサス・レンジャースのダルビッシュ有投手について解説していきます。

Tsutomu Jinji

Featured Posts