RiTurban‘sサイト解析ブログ
RiTurban‘sサイト解析ブログ
2010年06月21日
■平均PVを見ている人=イエローカード
小島「お前、嘘ついたのか!?」
ボーイ「いえ、嘘はついていません。」
小島「ウソつくな!さっきから俺のオカンが入れ替わってばかりやないか!」
ボーイ「だから平均25歳というのは・・・」
…
今日はアクセス解析の話ですが、
新宿2丁目のボッタクリBARに入ってしまった、
哀れな男、小島さん(36)の話から入ります。
なぜかというと、この話を知ると、
今までアクセス解析で気にしていた
平均値を見るのが、本当にバカバカしくなるからです。
いえ、むしろ平均値を見ていることに
危機感をおぼえるでしょう。
■小島さんが”平均25歳”に騙された理由
怒っていた小島さんは、
新宿2丁目のボッタクリBARに
“店の子は平均25歳”
という謳い文句で店にはいりました。
ところが、そこで働いていたのは、
自分の母親と同年代、60歳間近の女性が3人。
小島さんはたまらずボーイを呼びつけたわけです。
しかしボーイの言い分はこうです。
「働いている子の平均は、”僕も含めて”本当に25歳です」
■平均は間違える
一般的に、平均という言葉を使う場合は、
全員の年齢を足して、その人数で割ります。
でもそうすると、今回の小島さんのような悲劇がおこります。
男:20歳代がたくさん働く
女:60歳の人が3人
こうなると平均は25歳ということが起こりえます。
ボーイは嘘はついていないわけです。
今回のように平均というのは、
誤解を生む可能性が高い言葉です。
ですからこの計算式は統計学では算術平均といって、
平均という言葉とは区別します。
■どうすれば良かったのか?
いくら給料日後だったとはいえ、
新宿2丁目では
小島さんはもっと神経を尖らせるべきでした。
「平均25歳って、先に比率を教えてくれよ・・」
と低めの声で聞けば、
ボーイはこう答えたはずです。
「はい、20歳の子が21人で、60歳が3人です」
(ボーイの心中:こいつ、やるな)
これで、相当絞り込まれました。
あきらかに60歳が怪しいです。
しかしもし小島さんが、
もう本日3軒目で酔っ払っていたら、、
きっと都合の悪い60歳は聞こえず、
20歳が21人のバラ色ハーレムに、
鼻の下を伸ばしてサッサと店に入るでしょう。
だから本当に聞くべき質問は
「いったい、どんな女の人が働いているんだい?」
です。
■先に知るべきは、どんな人が働いているのか?(セグメント化)
今見てもらったように、
平均値だけで判断するというのは、
判断を誤らせる一番の要因です。
それより一番最初に知るべきは、
先程のボッタクリBARと同様
自分のサイトにはどんな人たちが来ているのか?
ということです。
それを知るために、
“セグメント“という考え方は大切です。
セグメントというのは、
集団をある任意のグループにわけて考えるということです。
例えば先程のボッタクリBARにおいては、
女性と男性の平均値を分けて知ることができれば、
判断を間違えることはありませんでした。
このように女性と男性というグループにわけて
考えるだけで、見えてくる景色は違います。
これをセグメントを分ける、と言います。
GoogleAnalyticsではアドバンスセグメントというものが
ありますが、これはこういったグループわけをするための機能です。
アクセス解析というのは、
実はそのセグメントをわけるところが
スタートラインだったりします。
セグメントを正しくわけることができれば、
判断の精度が上がってきます。
■直帰者を除く=有効なアプローチ
とはいえセグメントというだけで、
どのようなグループ分けにすべきか、
頭が痛くなる人もいるでしょう。
そういう場合は、まず
「直帰者を除く」
というアプローチをお勧めします。
なぜかというと、
あなたのWebサイトに訪れる人というのは、
大雑把にいえば以下のように分けられます。
1.あなたに全く興味がないか、あなたを嫌いな人。
2.なんとなく興味があるか、あなたを好きな人
1.のあなたのことを嫌いな人は、
あなたもNoThankyou!のはずです。
先程の例でいけば、
ボッタクリBARの男性のようなもので、
データとしてまったく必要ありません。
だから早々に取り除きましょう。
あなたのサイトに興味がない人というのは、
だいたい直帰します。
だから直帰者を除くと、
あなたを好きな人がほとんど残ります。
だからその人達を除いたデータで、
対策を考えることはとても有効です。
ちなみにこういったデータ歪める値を
統計学では”外れ値”と呼びます。
アクセス解析では、
直帰するユーザーというのは、
だいたいデータを歪める外れ値です。
ですので取り除いて考えましょう。
またもしあなたのアクセス解析ソフトが
滞在時間を正確に取得できるなら、、
サイト滞在時間が10秒以下の人を除く、
というのは、より有効なアプローチです。
(GoogleAnalyticsは無理です)
なぜならニュースサイトのように、
1ページだけ見て直帰するのが当たり前のサイトでは、
直帰するユーザーをエイッ!と取り除いてしまうと、
今度は逆に判断を間違えます。
より正確なのは、
間違えて10秒とサイトに滞在しなかった人を
取り除くことです。
まぁとにかく、
あなたに関係のあるユーザーを
見ていくという作業は大切です。
ぜひ今日から、直帰者を除いたデータを見てみましょう。
GoogleAnalyticsなら、
アドバンスセグメントの中に、
「直帰をのぞく」
というチェックボックスが最初からついています。
ぜひ試してみてください。