アクセス解析に役立つ確率統計学(ポアソン分布について)
2011年04月01日
「え!?来週は全然申し込みが入らない」
「来週の売上がいきなり0円になる?」
かなりピンチな事象ですが、
こんな確率ってどれくらいあるのでしょうか?
今日は、アクセス解析に役立つ確率統計学ということで、
こういったイレギュラーな事象が発生する確率を
求める方法を簡単にご紹介します。
■あなたのサイトの平均成約率は?
例えば、あなたのサイトの平均成約率が1%だったとします。
つまり100人アクセスがあれば、
1人が申し込んでくれるというサイトですね。
翌週も100人のアクセスがあれば、
通常は1人は申し込みがあると考えます。
しかし残念なことに、
翌週100人のアクセスがあったのに申し込み数は0人。。
実際こういったことはよくあります。
そうなった時にガッカリしないためにも、
この0人になる確率って先に求められないでしょうか?
■カンタンに確率を求める方法
ありがたいことに、
過去の偉人「ポアソン」という人がこの確率を
カンタンに求める法則を導き出しました
「一定期間の平均値がわかっているなら、後は任せておけ」
という法則です。
例えば今回は「平均成約率は1%」
と平均値がわかっていますよね。
このおかげで、先ほどの問題でも
平均成約率が1%の場合、
翌週(100アクセス)の申し込み数が0人の確率は
約36%とわかります。
結構高いですね。。
以下、計算式です。とても簡単です。
【計算式】
2.71(自然対数:e) ^ – 平均成約数
※^はべき乗を表します。
【今回の計算式】
申込数0の確率 = 2.71 ^ -1
→36%
※もし成約率が2%なら
申込数0の確率 = 2.71 ^ -2
→13%
となります。
■ポアソン分布とは?
ある一定期間や一定数における平均値がわかると、
平均値以外の値になる確率は特定の分布図になります。
これをポアソンさんが発見したので、
ポアソン分布と呼びます。
確率分布がわかっているので、
例えば
・来週10人申込む確率
・来週2人申込む確率
・来週0人が申込む確率
なども全部わかります。
詳しくはこちらをご覧ください。
▼ポアソン分布(Wikipediaより)
■最後に(補足)
今日はアクセス解析向けの
やわらかい確率統計学ということでお話しました。
あくまで0人の申込確率ということで、計算式を簡単にし、
詳しい説明はWikipediaさんにお願いしています。
まずはご紹介ということで、
ぜひ楽しんでみてください。
■補足の補足
楽しんでみてくださいといったのに、
もともこもない話ですが、、
実はウェブサイトにおいては、
あまりこの確率統計値を信じすぎてもいけないと、
僕は考えています。
理由は2つあります。
1つ目は過去から推測しているから。
結局、確率統計とは
「過去に起こった現象」
から考えることが限界です。
ですので例えば残念ですが、
3/11の大地震のように想定外の現象が発生する場合には、
確率統計学は無力です。
さらにウェブサイトというのは、
人間心理や社会の流行など、
刻一刻と変化する社会を反映したものなので、
あまり過去の確率統計値を信じすぎても、
間違いを犯してしまいます。
このあたりは投資家ジョージ・ソロスのいう
再帰性の話にも似ています。
2つ目は平均値の精度が低いと間違っちゃうから。
一口に100人サイトに訪問したら平均1人が申込むといいますが、
その内容をちょっと見てみましょう。
例えば鯖寿司を売っていて、
実は100人のアクセスのうち、
97人が「鯖寿司 作り方」という検索キーワードで、
たった3人が「鯖寿司 購入」というキーワードだった場合。
実際は97人は関係ないユーザーです。
3人が大切です。
ということは、
翌週200人のアクセスを集めても、
そのアクセスの質によっては、
結果はまったく変わってきます。
こういった事情がありますので、
少なくともキーワードグループや広告媒体毎に
平均成約率を求めておかないと、、
あま確率値が役に立ちません。
つまり事前のデータの精度をあげることが大切になります。
でもやり過ぎるとサンプル数が少なくなったり、
しんどかったりします(笑)
…
ということで、
あくまでこのポアソン分布などは参考データ程度に、
あとはやっぱり定期的に重要な値(例えば検索エンジンの順位や申し込み数)
などをモニタリングしながら、
“今”に対応していくことの方が重要だと考えています。