RiTurban‘sサイト解析ブログ

アクセス解析に役立つ確率統計学(ポアソン分布について)

2011年04月01日

「え!?来週は全然申し込みが入らない」
「来週の売上がいきなり0円になる?」

かなりピンチな事象ですが、
こんな確率ってどれくらいあるのでしょうか?

今日は、アクセス解析に役立つ確率統計学ということで、
こういったイレギュラーな事象が発生する確率を
求める方法を簡単にご紹介します。

■あなたのサイトの平均成約率は?

例えば、あなたのサイトの平均成約率が1%だったとします。

つまり100人アクセスがあれば、
1人が申し込んでくれるというサイトですね。

翌週も100人のアクセスがあれば、
通常は1人は申し込みがあると考えます。

しかし残念なことに、
翌週100人のアクセスがあったのに申し込み数は0人。。
実際こういったことはよくあります。

そうなった時にガッカリしないためにも、
この0人になる確率って先に求められないでしょうか?

■カンタンに確率を求める方法

ありがたいことに、
過去の偉人「ポアソン」という人がこの確率を
カンタンに求める法則を導き出しました

「一定期間の平均値がわかっているなら、後は任せておけ」

という法則です。

例えば今回は「平均成約率は1%」
と平均値がわかっていますよね。

このおかげで、先ほどの問題でも
平均成約率が1%の場合、
翌週(100アクセス)の申し込み数が0人の確率は
約36%とわかります。

結構高いですね。。

以下、計算式です。とても簡単です。

【計算式】
 2.71(自然対数:e) ^   – 平均成約数
※^はべき乗を表します。

【今回の計算式】
申込数0の確率 = 2.71 ^ -1 
→36%

※もし成約率が2%なら
申込数0の確率 = 2.71 ^ -2 
→13%
となります。

■ポアソン分布とは?
ある一定期間や一定数における平均値がわかると、
平均値以外の値になる確率は特定の分布図になります。

これをポアソンさんが発見したので、
ポアソン分布と呼びます。

確率分布がわかっているので、
例えば
・来週10人申込む確率
・来週2人申込む確率
・来週0人が申込む確率
なども全部わかります。

詳しくはこちらをご覧ください。
▼ポアソン分布(Wikipediaより)
http://homepage-shindan.com/url/file/Poissonwiki.html


■最後に(補足)

今日はアクセス解析向けの
やわらかい確率統計学ということでお話しました。

あくまで0人の申込確率ということで、計算式を簡単にし、
詳しい説明はWikipediaさんにお願いしています。

まずはご紹介ということで、
ぜひ楽しんでみてください。

■補足の補足
楽しんでみてくださいといったのに、
もともこもない話ですが、、

実はウェブサイトにおいては、
あまりこの確率統計値を信じすぎてもいけないと、
僕は考えています。

理由は2つあります。

1つ目は過去から推測しているから。

結局、確率統計とは
「過去に起こった現象」
から考えることが限界です。

ですので例えば残念ですが、
3/11の大地震のように想定外の現象が発生する場合には、
確率統計学は無力です。

さらにウェブサイトというのは、
人間心理や社会の流行など、
刻一刻と変化する社会を反映したものなので、
あまり過去の確率統計値を信じすぎても、
間違いを犯してしまいます。

このあたりは投資家ジョージ・ソロスのいう
再帰性の話にも似ています。

2つ目は平均値の精度が低いと間違っちゃうから。

一口に100人サイトに訪問したら平均1人が申込むといいますが、
その内容をちょっと見てみましょう。

例えば鯖寿司を売っていて、
実は100人のアクセスのうち、
97人が「鯖寿司 作り方」という検索キーワードで、
たった3人が「鯖寿司 購入」というキーワードだった場合。

実際は97人は関係ないユーザーです。
3人が大切です。

ということは、
翌週200人のアクセスを集めても、
そのアクセスの質によっては、
結果はまったく変わってきます。

こういった事情がありますので、
少なくともキーワードグループや広告媒体毎に
平均成約率を求めておかないと、、

あま確率値が役に立ちません。

つまり事前のデータの精度をあげることが大切になります。
でもやり過ぎるとサンプル数が少なくなったり、
しんどかったりします(笑)


ということで、
あくまでこのポアソン分布などは参考データ程度に、
あとはやっぱり定期的に重要な値(例えば検索エンジンの順位や申し込み数)
などをモニタリングしながら、
“今”に対応していくことの方が重要だと考えています。