偏差値181億に真剣に立ち向かう話(3)―数学的アプローチによる検証―

※この記事はMathJaxおよび\LaTeXを使用しています。

今回は下記記事の続き、「数学的アプローチ」についてとなります。

th53439830.hatenablog.com

なお、これ以降では自然対数の底eに対し、そのべき乗である関数を

\begin{align}
e^t=\exp(t)
\end{align}

と表記することにします。

偏差値の正体と前回使用した計算式との関係性

平均\mu、分散\sigma^2標準偏差\sigma)の正規分布を表す確率密度関数

\begin{align}
f(x)=\frac{1}{\sqrt{2\piσ^2}}\exp\left(-\frac{(x-\mu)^{2}}{2σ^{2}}\right)
\end{align}

であり、そのグラフは下図の通りである。

f:id:TH53439830:20200409005224p:plain

ここで、グラフとx軸の間の面積について、

\begin{align}\int_{a}^{b}f(x)dx\end{align}

は確率変数xa以上b以下となる確率を表し、特に、

\begin{align}
\int_{\mu-σ}^{\mu+σ}f(x)dx\fallingdotseq0.6827,&\int_{\mu-2σ}^{\mu+2σ}f(x)dx\fallingdotseq0.9545,\\
\int_{\mu-3σ}^{\mu+3σ}f(x)dx\fallingdotseq0.9973,&\int_{-\infty}^{\infty}f(x)dx=1
\end{align}

である。今回取り扱う「偏差値」は平均が50、標準偏差が10なので、

\begin{align}
f(x)=\frac{1}{10\sqrt{2\pi}}\exp\left(-\frac{(x-50)^{2}}{200}\right)
\end{align}

となる。

したがって、前回取り上げた「1-CDF[NormalDistribution[50,10],x]」との関係性は、

\begin{align}
1-{\rm CDF[NormalDistribution}[50,10],x]=\int_{x}^{\infty}f(t)dt
\end{align}

と表される。

Level1:偏差値=81を再計算する

f:id:TH53439830:20200409014955p:plain

前回との差もなく大丈夫そうである。いよいよここからは未知の領域へ……

Level2:偏差値=11,081

f:id:TH53439830:20200409015404p:plain

すなわち偏差値11,081は上位2.3215×10-264233%となる。かの有名な大企業Google社の社名の由来となった巨大数グーゴルは10100である。その2642乗分の1よりも小さいのである。とはいえ、統計学用関数から数式に切り替えたおかげで、前回超えられなかった壁を一つ越えたことに感謝して、次に進もう。

Level3:偏差値=111,081

f:id:TH53439830:20200409022945p:plain

すなわち偏差値111,081は上位6.8851×10-26769661%。もはや尺度も何もない状況である。

Level4:偏差値=18,111,081

f:id:TH53439830:20200409232850p:plain

メッセージ:「Wolfram Alphaはクエリを理解できません」

Wolfram Alpha、2度目の敗北である。

誠に残念である(何が)。では偏差値いくつまでなら計算できるのか。

f:id:TH53439830:20200412234552p:plain


f:id:TH53439830:20200412222258p:plain

どうやら100万ですら計算できない様子。これでは先へは進めないのも当然である。

現状のまとめ

下表に、現時点での計算結果をまとめておく。2つ進んだが2つ残ってしまった。

  偏差値 上位◯%
統計学的アプローチ 数学的アプローチ
Level1 81 9.6760×10-2 9.6760×10-2
Level2 11,081 計算不可 2.3215×10-264233
Level3 111,081 6.8851×10-26769661
Level4 18,111,081 計算不可
Level5 18,118,111,081

今回はここまで。次回は「科学的アプローチ」で再々検証を行う予定である。