宝くじの分析に意味はあるか

誰もが人生で一度は思うことの1つは「宝くじにでも当選しないかな」だろう。宝くじで1等当選すれば億という金額が手に入り、何でも好きなことができる。特に年に数回行われるジャンボ宝くじは世間の注目度が高くニュースにもなるほどだが、実は宝くじには複数の種類があり、数字選択式の宝くじは毎平日開催されている。数字選択式、つまり自分で数字を選べるという性質から、過去の当選番号を分析して当選確率を上げようと努力している人がいるのだが、果たしてその努力に意味はあるのか。

宝くじの分析

例えばロト6であれば、1~43の自然数から6つを選び、当選番号6つ+ボーナス数字1つの内、複数個一致していれば当選となる。1等は当選番号6つと一致、2等は当選番号5つ+ボーナス数字と一致…というようになり、最低の5等ですら当選番号3つと一致する必要がある。

このような数字選択式宝くじには「当選しやすくなるテクニック」が複数存在し、過去の当選番号の傾向を分析することで、今回出るであろう番号を導き出すことができるという。「前回の当選番号の内、1つを含ませる」「連番を1組作る」といったものだ。気になるのは、その分析によって本当に当選確率が上がるのかということだろう。もし本当に上がるのであれば、ぜひ分析の仕方を学び、億万長者になりたいものだ。

宝くじの分析に意味はあるか

宝くじの分析の効果を評価するためには、分析によって得た大量の結果が必要になる。そのような都合の良いデータがないかと探したところ、「うまさく」というサイトが見つかった。このサイトは「うまさくセレクト」という、過去のデータ分析を基に数字をランダムに出力してくれるシステムを提供している。分かりやすく単純化して言えば、「1・2・3・4・5・6」のような直感的にもあり得ないと思える組み合わせを省いて出力するのだが、利用者の出力した組み合わせをデータとして持っており、その回の当選数を公開してくれている。内部の詳しいロジックは分からないが、データ分析を基に出力を行っていてデータ数もそれなりにあるため、今回の検証には打ってつけと言える。ただし、自分でいくつかの数字を選択、除外して残りをランダムに出力する機能もあり、すべてが完全にデータに基づいた出力ではないことは断っておく。

ここではロト6におけるうまさくセレクトのデータを利用し、第1568回~第2002回の435回分のデータ(合計選出数:31,219,218)で検証を行う。結果は以下の通り。

うまさくの実績理論値差(実績-理論値)
1等5回5.12回-0.12回
2等35回30.73回+4.27回
3等1,113回1,106回+7回
4等48,861回51,157回-2,296回
5等775,694回795,785回-20,091回
合計825,708回848,083.85回-22,375.85回

表を見れば分かるように、全体として見ると寧ろ当たりにくいという結果となった。1等と3等に関しては理論値通りだが、言い換えれば当たりやすくなってはいない。4等と5等に関しては理論値より劣っていて、当たりにくくなっている。これはおそらく、過去のデータから「ありえなさそうな組み合わせ」を省いているが、実際の抽選ではその「ありえなさそうな組み合わせ」も出力されるからだろうと思われる。例えば過去のデータ分析によって43個の数字の内20個に絞って出力した場合、その中から当選番号(+ボーナス数字)が選ばれた場合のみ当選確率は上がる。一方で、捨てた23個の数字から1つ以上選ばれることが多いため大外れになるケースも多く、4等と5等の当選数が下がる一因になっていると考えられる。

2等に関しては理論値より約4回多く当選しているが、当たりやすくなると判断するのは早計であり、単なる偶然の可能性も捨てきれない。というのも、435回の抽選の中で数回だけ上振れた可能性があるからだ。ここで仮説検定によって単なる上振れかどうかを判断すると、2等の当選回数が35回以上になる確率は24.8%であり、一般的に判断の基準として用いられる5%より高いため、偶然でも十分に起こり得る事象であることが分かる。つまり2等の当選数が理論値より多いのは偶然であり、上振れただけと言っても差し支えない。(5%より低ければ偶然とは考えにくく、分析の成果によって当選数が多くなっていると判断できる)

これらより、うまさくセレクトが提供する第1568回~第2002回の435回分のデータにおいては、宝くじの分析によって当選確率は上がるどころか、選択する数字に偏りが出ることから、4等や5等に至っては下がってしまうと分かった。

偏りこそが確率

「実際にデータを見れば、前回の当選番号の1つが今回も選ばれることが多い。だからデータの分析には意味がある」などの反論で足掻きたい人がいるかもしれないが、前回の当選番号に影響されて今回の番号が選ばれるわけではなく、43個の数字から6つを選ぶ際に、特定の6つの内の少なくとも1つが含まれる確率がそもそも高いというだけの話だ。前回の当選番号が「1・17・19・23・36・42」である場合、これら6つの数字を少なくとも1つ含む組み合わせが全6,096,454通り中3,771,670通りあり、計算上約62%で前回の番号と被るため、実際の当選番号もそのようになっているに過ぎない。より分かりやすく言えば、前回の当選番号が特別なわけではなく、前々回の当選番号である「13・21・24・26・34・36」であっても、「1・2・3・4・5・6」であっても、1つ以上が被る確率は約62%で同様だ。

他にも、曜日や六曜、セット球ごとなどに当選番号をまとめ、出やすい番号を分析している人もいるが、これも意味がない。そもそも確率というのは偏りが出ることが自然であり、むしろすべてが均等になる方が不自然だ。例えばサイコロを6回転がした際、1~6の目が1回ずつ出る確率はたった1.54%しかなく、1回ずつ出るまでにかかる平均の回数は14.7回と計算できる。以下は私がオンラインサイコロを使って、1~6のすべての目が出るまでサイコロを振るという作業を3セット行った結果だ。

回数出目(1セット目)出目(2セット目)出目(3セット目)
1回目355
2回目111
3回目253
4回目166
5回目156
6回目113
7回目151
8回目552
9回目323
10回目315
11回目344
12回目41
13回目36
14回目62
15回目3

1セット目に着目して話を進めよう。期待値に近い14回目で1~6のすべての目が出揃っている。14回目までの出目を見てみると1と3が非常に多く、しかも連続で出現しているが、これこそが自然な確率の在り方だ。当然このサイコロは1と3が出やすいわけではなく、15回目の出目として1か3の出る確率が高いわけではない。14回目までの結果とは関係なく、どの目も1/6で出現する。

このように少ないサンプル数で確率のデータを見ると、法則性があるように錯覚してしまうが、実際には人間が後付けで「法則」を見出しているだけであり、ただ単に確率通りの事象が起きているに過ぎない。サイコロであればおそらく皆が1/6だと理解できるのだが、ロト6の話になった瞬間に「法則」を信じてしまうのだ。「当選しやすくなるテクニック」という幻の手法を使って宝くじの分析という無駄な時間を過ごすより、クイックピックで自動的にランダムで選んでしまった方が良いだろう。