RiTurban‘sサイト解析ブログ

visits(セッション数)とvisitors(ユニークユーザー数)の違い

2011年05月26日

Googleの公式ページにあるけど、ややこしいのでメモ。
要はvisitsはセッションで、visitorsはユーザ数です。

▼まず英語

Visits vs. Visitors

Analytics measures both visits and visitors in your account. Visits represent the number of individual sessions initiated by all the visitors to your site. If a user is inactive on your site for 30 minutes or more, any future activity will be attributed to a new session. Users that leave your site and return within 30 minutes will be counted as part of the original session.

The initial session by a user during any given date range is considered to be an additional visit and an additional visitor. Any future sessions from the same user during the selected time period are counted as additional visits, but not as additional visitors.


▼日本語訳(結構、原文に追加されています)
http://www.google.com/support/analytics/bin/answer.py?answer=57164#visits_vs_visitors


セッション数、ユーザー数、およびユニーク ユーザー数

Analytics では、お客様のアカウントのセッション数とユーザー数の両方を測定します。 セッション数は、お客様のサイトのすべてのユーザーによって行われた個々のセッション (訪問) の数を表します。 ユーザーがお客様のサイトで 30 分以上操作を行なわなかった場合、それ以降の操作は新しいセッションとみなされます。 いったんお客様のサイトを離れたユーザーが 30 分以内に同じサイトに戻ってきた場合は、最初のセッションの一部としてカウントされます。

ユーザーとは、ウェブ サイトにアクセスしたと明確に識別されるユーザーの実際の数を正確に定義するための概念です。 2 人以上のユーザーが同じコンピュータを共有しているかどうかをウェブ サイト側で識別することはできませんが、実際の数に最も近い値を得ることができます。 Analytics は最も正確なユーザーのトラッキングシステムである、クッキーを使用して、個々のユーザーをトラッキングしています。

「ユーザー数」は、日別にお客様のサイトを訪問したユニークなユーザーの数を表します。 同じ日に同じユーザーが行ったセッションがすべて単一のユーザーに集計されるため、1 人のユーザーが複数のセッション数を表す可能性があります。

[ユニーク ユーザー数] レポートには、カレンダーで選択した期間全体で同じユーザーが行ったすべてのセッション数が対象となるため、ユーザーがお客様のサイトに訪問した日数や、 それぞれの日にお客様のサイトを訪問した回数(セッション数)にかかわらず、ユニーク ユーザーは 1 人とカウントされます。



でもこのページ見てみた人って、きっとGAのAPIとか触っているんですよね。。

データ取得してみるとわかりますが「数値がおかしい!」と思うことが多いですね。

例えばDataExportAPIのディメンションをpathPathにして、フィルターかけて取得するとメトリクスのvisits(セッション数)の方がvisitors(ユーザー数)より小さくなります。
(どんな集計方法か僕なりに思いを巡らせてみましたが、いまだ思いついていません。)

更に問題があって、GAのUIを使った通常のレポートと値がずれることもしばしばです。

その多くの理由は、GAのUIで投げているクエリとこちらがDataExportAPIで投げているクエリが違うから、ということのようです。

▼参考(英語です)
http://groups.google.com/group/google-analytics-data-export-api/browse_thread/thread/576187fcf4e2916c/debc0421ab8824ef?lnk=gst&q=UI+API+does+not+match#debc0421ab8824ef

僕はここの人が途中で触れているタイムゾーンもちょっと怪しいと思っていますが。。
とにかくクエリを投げてもエラーにならずデータ取得できるので、どうやったら正しいデータが取得できるのかわからないことも多いです。(もともと情報も多くないし)

でももともとGAはクッキーが有効でないブラウザでは値が取得できませんし、
リロードされるとページビューも加算されますし。。

要は値の正確性にはもともと疑問符が残るツールなわけです。

そう考えると、大切なことは、同じクエリでデータを取得し続けて、数値の厳密さにこだわるよりは、基本的に時系列の変化&傾向(トレンド)を見るというのが本線でよいと思います。