久しぶりにこのシリーズです笑
以前のエントリはこちら
part1 導入編
part2 勝率、試行回数編
part3 確率、収束の概念編
今回は最頻値を取り上げたいと思います。
期待値というのは確率変数の平均値のことでした。
しかし、平均値にはいくつか種類があるのを皆さんはご存知でしょうか?
一般に平均といえば「全部足して、足した個数で割る」というものを思い浮かべる人が多いでしょう。
期待値もこれの一部と言えます。
数学的には相加平均と呼ばれるものです。
(※今回のエントリで「平均」と言えば、特に断りが無い限りこれを指します。)
今回取り上げる最頻値は、統計学で扱われることの多い平均値の一つです。
簡単な定義としては、扱うデータの中で最も数が多いデータのことです。
具体的な数字で説明します。
{10,10,10,10,20,20,20,100}
このようなデータがあったとします。
この時平均は、200÷8=25です。
一方で最頻値は、8個のデータの中で最も数の多い4個の「10」が最頻値になります。
どちらも平均値として扱われるのに、25と10で結果がずれています。
この最頻値と「平均」の数字のずれは、スロットをやっていると頻繁に遭遇することになります。
例えば、
・フリーズの平均獲得枚数
・上乗せ特化ゾーンの平均上乗せG数
・天井期待値(シュミレート値)
これらはすべて「平均」であり、最頻値ではありません。
{10,10,10,10,20,20,20,100}
このデータを、上乗せ特化ゾーンの結果だと思ってみてください。
メーカーがこのデータをもとに平均25Gと紹介したとしたら、実際に打ったとき8回中7回は平均を下回るのです。
このようなずれを生じさせているのは、データの中に「外れ値」があるためです。
外れ値とは上のデータでいう「100」のことです。
「平均」はこのような外れ値の影響を受けやすいという特性があります。
同時に、part3で試行回数の話に触れましたがそれと同様に、データの数が多ければ多いほど、外れ値の影響は小さくなるという特性もあります。
しかし、スロットのように上限と下限の幅が大きく、大きな外れ値を生じる分布の中では、平均は実際の感覚と異なることが多くなりがちです。
中でもとくに気を付けたいのが、天井期待値の情報です。
雑誌では、「シュミレート値10万回試行」という注意書きつきの天井期待値がよくのせられています。
パチスロで扱われる確率分母の大きさから考えると、これらも外れ値の影響を受けていると考えるべきです。
また天井期待値のデータに外れ値が生じやすい機種というのも存在します。
フリーズに出玉を左右されやすく、かつ、フリーズが比較的高確率なものです。
具体的には、鉄拳デビルverとかミリオンゴッドとかプリズムナナとかです。
これらは、初当たり確率以上に確率分母の大きいフラグに出玉量を左右されるため、普通の機種以上に外れ値が生じやすくなっているためです。
期待値を過信しすぎて最頻値を意識しないと、データの表面に騙されて危険な中身に触れることになるということですね。
ではではノシ
コメント