平均台


統計学の生み出した最も便利で最も危険な指標?平均値。 

「わかりやすすぎる」だけに・・・

「平均値」は、私たちの生活に見事に浸透しています。
たとえ数学オンチの方々でも「平均値」の意味はわかっていると思います。
そう、「全部足して人数/個数で割る」だけでいいのです。

あまりにわかりやすい指標なので、とにかくよく使います。
しかし、ダイエットにおける「体重」もそうですが、あまりにわかりやすい指標には要注意です。
「体重減少」がダイエットの本質ではないように、「平均値」は「実態」を表していないことが多々あります。

まだ「テストの点数」のように、0~100点の範囲におさまっているものは一応意味があります(それでも意味ない場合がけっこうあるけど)。
一方で、とくに「年収」みたいな、範囲が決まってない「青天井」な指標だと要注意です。
年収100万円のボンビーな人が9人いて、年収1億円の人が1人いたら、10人の「平均年収」は1090万円になります。
この平均値は「実態」を全く表してません。
これは極端な場合ですが、「平均年収」はほとんど意味ないことが多いです。
さすがに最近は意味のなさが浸透してきてるみたいですが。


逆に「平均値」がちゃんと意味をもつ場合

この「平均値」、最近はメディアなどで悪用?されすぎて「平均値」自体が何か悪者にされてる感すらあります。
しかし「平均値」自体に罪はありません。悪いのは勉強不足のあなた?です。
平均値がちゃんと意味をなすのは、こういう場合です。

正規分布

横軸は「点数」だの「年収」だの、考える対象の量で、縦軸は「存在割合」です。
テストの点数だとわかりやすいですかね。
平均点を50点だとすると、上のグラフの状態は、

クラスの大半が50点付近の点数
ごく少数のできるヤツが高得点
またごく少数の残念なヤツが低得点

ということになります。
学校のなかのテストだと、入学直後の、実力差がそれほどついてない場合によくありがちな分布です。
また受験者数が多い、全国模試などでもこういう分布が出ます。

このケースだと、「平均値」がちゃんと意味をなします。
まさにその集団が「平均してどのくらいの実力か」を反映しています。
こういう分布のことを「正規分布」といいますが、これはこれで非常に深い話になりますので別の機会に。


では逆に、卒業間際?でクラスの中でも実力がピンキリになっている状態でのテストだと


へんな分布

こんな感じになっちゃいます。
クラスの中で0点から100点までまんべんなくいる、という状態。
この状態で「平均値」を計算しても、あんまり意味がありません。
(たぶん50点ぐらいになるのでしょうが)
「このクラスは平均して50点ぐらいの実力があります」といわれても、なんだかな~ですね。
さっきの「10人の平均年収は1090万円です」みたいな。


「年収」みたいな青天井な量だと、まず「正規分布」にはなりません。
ところが数学オンチの人は「分布」のことを一切考えず、「平均値」がまさに「その集団を最もよく表している量だ」と認識してしまいます。
「理科悪用詐欺」はちゃんとした「ウソ」であることが多いと思いますが、この「統計悪用詐欺」はこれまで説明した感じで

「ウソ」ではないけどアホが誤解する

のパターンです。勉強しましょう。


これも詐欺だけじゃなくて・・・

前回の「リファレンスなし」と同様、この「平均値だけ考えちゃう」についても、製造業におけるしょうもない争いのネタになったりします。
今回のお話はもうちょっと深い話ですがね。
まとも?な製造業においても、製品スペックの「平均値が高いこと」のみを追求するあまり、ろくでもない仕事をしてしまうことがけっこうあったり・・・

工場では「歩留まり」(要は良品の割合)が最重要課題なので、「分布」は一応ちゃんと考えます。
なんでもいいですが、とりあえず「100」の値が出ないといけない製品があったとして

1.平均105だが、99~111の範囲でバラついている
2.平均103だが、101~105の範囲でバラついている


という2つの作り方があったとしたら、2のほうが選ばれます。
一応ね。

本当の一流の製造業だと違うのでしょうが、残念ながら2流の製造業では、製品を開発していく段階で、まずは平均値を高める、ということをしがちです。

もちろん、開発の段階ではいきなり「100」の値は出ずに、下手したら5とか10とかの段階からスタートすることが多いです。
もちろん平均値を高めるのは重要なのですが、「平均値のみ」を追及するあまり、開発していく中で「すごく不安定な作り方」になってしまうこともしばしば。
なんとかして締め切りまでに「平均値100」を(無理やり)達成したとしても、気が付いたときにはすごくバラつきの大きい状態(90~110の間、とか)になってしまったり。

そこで社員は慌ててバラつきを抑えにいくのですが、これがけっこう大変。
「平均値100」を達成するためにいろいろなところを「最適化」してしまっているので、いまさらいじれずに、ニッチもサッチもいかなくなってしまいます。

「平均値100」を達成する前に、最初から「バラツキを抑えに行く」ことを意識しなければならないのです。
これはけっこう深い話なので、別の機会にじっくりお話ししたいと思います。


とにかく、この「平均値」という魔の?指標ですが、あまりにわかりやすい指標のため、詐欺にも使われるし、「まともな理系人」が決めているはずの大企業の判断を狂わせたり、人類にいろいろ不幸をもたらしているのです。

ひっひっひ。



はっぴぃ理系らいふ、いぇい
ヽ(・ε・)人(・ε・)ノ キミモナカマニナロウゼ
   

【文責 べじぱみゅ】