RiTurban‘sサイト解析ブログ

衣袋氏「ウェブマーケティング分析に必要な統計セミナー(2011/5/11)」の感想

2011年05月13日

5月11日に開催された
「ウェブマーケティング分析に必要な統計セミナー」
http://a2i.jp/activity/lecture/8124

に参加してきました。

このサイトでもちょくちょくご紹介している
衣袋宏美氏(a2i副代表)のセミナーです。

なかなか珍しい切り口なので、
とっても楽しみにしていたのですが、
案の定、大変面白かったです。

本日はそのセミナーの感想などを。

はじめにセミナーの大項目ですが
————
第一部:誤差と統計値
第二部:用途別の落とし穴
————
となっていました。

第一部は主に「データに騙されるな!」という内容。
第二部は特によくアクセス解析で収集されるデータについての注意点についてでした。

さすが衣袋さんらしく、
「データ」というものについて
改めて考えさせられる内容でした。

セミナーの内容を全部お伝えするのは無理ですが、
以下、僕が特に勉強になった点を5つピックアップしてお伝えします。

————-
・データやグラフには制作目的がある(だから騙されないで!)
————-

人は数字を信じてしまうものですが、
結局のところ「数字」というのは
目的にあわせて”作り込める”ということです。

例えば
「この洗剤を91.8%の人が気に入っています!」
という宣伝文句を見ることはよくあります。
(大手企業もやっています)

しかし一口に91.8%といますが。。

・誰にアンケートをとったの?
・細かくいうと洗剤の”何”を気に入っているの?

ということは本来、
公平な判断や予測をする上では、
とても重要なわけです。

だから少なくともマーケッターやアクセス解析をする人は、
・データ(数字)をすぐに信じるのはやめようね、
・データの根拠を知ろうね、
という話でした。

————-
・統計確率的な誤差とは何か?
————-
具体的な「標本誤差」の計算式をもとに、
・誤差はなぜ発生するか?
・その誤差の発生確率はどうなるか?
・統計的に信じれるデータを得るにはどうするか?
というお話がありました。

誤差は主に3つの要素(割愛します)で発生しますが、
統計に基づいて確率計算を行うためには
・収集データに偏りがないこと
がとても重要だということです。

逆に言えば、偏ったデータしか集められない場合、
統計的に高確率で信じれる値を求めることは不可能です。

では、そういったことが保障されない場合、
統計の知識は役立たないのか?
という話になってきます。

そこで。。

————-
・偏ったデータしか収集できない場合はどうすればいいか?
————-
これは私が衣袋さんにご質問したことでした。

特にアクセス解析で集めるデータというのは、
もとから母集団の予測が難しいし、
従ってランダムにサンプル(標本)を集めることは
不可能に近いわけです。

つまりデータの偏りが前提です。

じゃぁ収集データをどう利用すべきか?

その場合の衣袋さんのご回答としては
「傾向把握には向いている」
ということでした。

つまり収集されたデータを元に
絶対値の判断は難しいけど。。

例えば2月は申し込みが少なそうとか、
日曜日はアクセスが平日より少ないとか、
そういった傾向把握には利用できるということです。

トレンド把握やモニタリングが大切ということですね。

アクセス解析でモニタリングが重視される理由の
裏付けにもなりました。

————-
・解析ツールが何を計測・収集しているか正確に把握しよう
————-
統計的な考え方を推し進めるには、
当然ですが元データの精度や偏りについて
ある程度の認識が重要です。

ところが解析ツールというのは、
用語が同じだったとしても、
まったく別の計測や収集をしていることがよくあります。

そういった収集方法に注意しないと、
やはり判断を間違えてしまうので。。

まずはデータの収集方法を正しく知らなくてはならない、
というお話でした。

————-
・人の認識はアテにならない
 (※僕へ)→だからちゃんと計算しよう^^;
————-
衣袋さんのセミナーではクイズが多様されますが、
そのクイズを解いてみての僕の感想は

「思ったよりも◯◯」

でした。

例えば

・グラフから”思ったよりも”平均値は小さい
・”思ったよりも”人それぞれで認識はバラバラ”

といった感じです。

僕は傾向把握にグラフを多様することが多いのですが、
逆に平均値などの数値を求めることはおざなりにしていました。
(あまり算出する数値に意味がないと思っていたから)

ところが、実際にある程度は数字を出してみないと、
データをみた全員の共通認識がおかしくなります。

思ったよりも◯◯

が発生してしまうわけです。

ということで、
やっぱり、何か気づきを得るためにも、
一般的な数値は全て計算してみるべきだと思いました。


総じての感想ですが、、

改めてサンプル(標本)に対する考え方や
数値を求めることの重要性に気づかせてくれた本セミナーは
大変有意義でした。

僕自身、もう一度確率統計学にチャレンジする気持ちがわいていて、
こんな本も買いました。



「マンションの価格に一番影響するのは立地?」

といったわかりやすい事例をもとに、
かなり具体的な例で理屈とエクセルの操作方法を説明してくれるので。。

学生時代に確率統計が苦手だった(つまり僕み たいな人)
にはお薦めです。

あとは、これら知識をひっさげて、
実際のデータに取り組み、判断していくという
実践セミナーに参加することが重要なんだと思います。

※まぁこれですね。
▼アクセス解析ゼミナール
http://a2i.jp/activity/semi/7683

少々高額ですがいつか参加してみたいと思っています^^;

あとはこういった数値や統計学に敏感になるためにも、
少なくとも衣袋さんのメルマガをみて

「データに強くなる/慣れる」

という訓練は必要だと思いました。