村上さえ打てば・・・

今年のヤクルトもチーム成績としては残念な感じになっていますが、そんな中2019年シーズンには「
村上」という希望の星が現れました。チームが連敗中には「村上がホームランを打ったか否か」だけを気にしている時期もありました(^_^;)

そんな中ある日のネット速報を見ていて「ヤク ソロHRで先制」という見出しがあり、先制したことはわかるけど打ったのが誰か書いていませんでした(記事にはもちろん書いてあり、確か青木でした)。その時に非情な?私は思いました。

打ったのが村上か否かだけ教えてくれ!

今日はこれを数学的に考えてみます。ちゃんと書くと

「ヤクルトのある打者がホームランを打ったとき、それが村上である確率」

を求めるのです。これ実はあの「ベイズ統計」の初歩となる重要な問題なのです。

その記事の日のスタメンは忘れちゃったので、仮に今日のスタメンをこのメンバーだとします。

1:(三)太田
2:(中)青木
3:(二)山田
4:(左)バレンティン
5:(一)村上
6:(右)雄平
7:(遊)西浦
8:(捕)中村
9:(投手)


この状況で二回か三回らへんに(いい加減な)ネット速報で「
ヤクルトの誰かがホームランを打った」という情報だけが入ってきたとします。さて、打ったのは誰でしょうか?(記事をちゃんと読め、というご指摘はご遠慮ください)

打者N巡させてみる

「普通に」考えれば、さっきのメンバーでホームラン打ちそうな人を思い浮かべれば山田かバレか村上だろうな、となるのですが、この
「確率」をマジメに計算するのです。

といってもよくわからないので、頭の中でさっきのメンバーを打者N巡させてみます。一巡したぐらいじゃホームラン出ないかもしれないので、例えば百万巡(相手ピッチャー死ぬ!)させます。

するとたくさんホームランが出るのですが、各選手が打ったホームラン数は例えばこんな感じになります。(実はこれ適当でなくマジメに計算した結果だけど)

打者百万巡

横軸は打順で、やっぱり三番の山田、四番のバレ、五番の村上がたくさん打つことが予想されるわけです。この仮想実験で出たトータルのホームラン数のうち
村上が打った本数

村上のホームランの割合
が求める
「ヤクルトのある打者がホームランを打ったとき、それが村上である確率」の答えです。スタメン8人に限定してるけど。

ではこの「仮想実験」で各選手がどれほどホームランを打つのか、について考えます。さっきの式を変形します。分母と分子を、打者一巡させた数(ここでは百万。つまり各打者が打席に立った数)で割ります。

村上のホームランの割合_変形

分子はまさに村上の「
本塁打率」に相当します(1打席あたり何本ホームラン打つか)。そして分母はスタメン8人の「本塁打率」の和に相当します。

「本塁打率」は単純に、今年のNPB公式データから引っ張りましょう。

本塁打率

2019年シーズンの、6月30日時点でのデータです。本塁打数を打席数で割ったものが本塁打率です。なお「打者の良さ」を比較する意味での「本塁打率」は分母に「打席数」ではなくそこから四球や犠牲フライなどを除いた「打数」を用いますが、今は単に「どれだけホームランを打つか」だけを議論しているので分母は「打席数」です。

この値を用いて「ホームランを打ったのが村上である確率」を出してみました(せっかくなので他の7人も出しました)。

HR打ったのは誰か

こうです。実はさっきの「打者百万巡」の結果はこれと同じです(本塁打率に百万をかけた数字です)。
村上の確率が一番高く、約22%もあります。

情報を出し惜しみするソース

ちなみに今の結果は
「スタメン野手の誰かがホームランを打った」という「事前情報」しかないときの結果でした。では仮に、何らかの方法で打ったのが左打者だ」とわかったらどうなるでしょうか?(ずいぶん情報を出し惜しみするソースだこと)

HR打ったのは誰か(左限定)

こうなります。左打者のなかだけで計算すればよく、
このときは50%の確率で村上です。「左打者である」という「事前の追加情報」によって絞れたわけです。

次回もう少し議論しますが「同じ情報を得たとしても、その時点で持ってる事前情報によってもたらされる結果は異なる」ということです。当たり前のことなのですが重要です。


はっぴぃ理系らいふ、いぇい
ヽ(・ε・)人(・ε・)ノ キミモナカマニナロウゼ
   

【文責 べじぱみゅ】