一般公開用の本サイトのテスト用サイトを設置している場合、テスト環境にも同じGoogleアナリティクスのトラッキングコードが記載されていることがあります。
その場合、テストサイトにアクセスしても計測されてしまうので、テスト環境へのアクセスを除外する設定をしましょう。
テスト環境の計測を除外する設定方法を知っておくと、他のノイズとなるトラフィックが計測される問題にも応用できるので、ぜひ覚えておきましょう。
目次
Googleアナリティクスにおけるホストとは
テスト環境の除外設定などをする時に出てくる言葉に「ホスト名」があります。
まずは『ホストって何?』ということを理解しておきましょう。
ホストとは、ネットワークを通じて端末から送られてくる要求を処理し、端末にその処理結果を提供するコンピュータのこと。
ホスト – インターネット用語辞典 – より
ホストのそもそもの意味としては「主催側、提供側、もてなす側」というような意味合いですよね。コンピュータ用語としても、同じようなニュアンスの意味です。
Webでの利用ケースにおいては一般的に、Webサイトの置かれているサーバーをホストと呼びます。
ユーザーの端末はクライアント(ゲスト)です。
Googleアナリティクスにおける「ホスト名」には、ドメインやIPアドレスなどが扱われます。
いずれもホストの住所を表す情報ですね。
設定を行う上ではひとまず、ホスト名 = ドメイン名 と考えておけばわかりやすいですね。
それでは、実際の設定方法を見ていきましょう。
テスト用ドメインを除外する設定
まずは文字通りに、フィルタで除外する方法です。
アカウントメニューまたはビューメニューからフィルタの作成画面を開きます。
[フィルタ名]に任意の名前を入力し、[フィルタの種類]で[定義済み]を選択します。
3つのプルダウンメニューを次のように指定します。
[フィルタの種類を選択]を[除外]
[参照元かリンクを選択します] を [ホスト名へのトラフィック]
[式を選択します]を[等しい]
[ホスト名]に「test.example.com」のようにテスト用ドメインを入力します。
[保存]をクリックしてフィルタを作成します。
テストサイトに限らず、ホスト名(ドメイン)を指定して除外することができます。
やる意味はありませんが、本サイトのドメインを指定したなら、それ以降サイトのアクセスデータはなくなってしまいます。
サブディレクトリにテスト環境を設置している場合
もしもテスト環境をサブディレクトリに設置している場合は、サブディレクトリの除外設定をします。
[フィルタ名]を入力して、[フィルタの種類]を[定義済み]にします。
3つのプルダウンメニューを次のように指定します。
[フィルタの種類を選択]を[除外]
[参照元かリンクを選択します]を[サブディレクトリへのトラフィック]
[式を選択します]を[次を含む]
[サブディレクトリ]入力欄にテスト環境のディレクトリを入力します。
「http://example.com/test/」がテスト環境であれば「/test/」と入力します。
[保存]ボタンで完了します。
本サイトのドメインのみを計測する設定
テストドメインを除外するのではなく、本サイトのドメインと一致する場合のみアクセスを計測するというやり方もあります。
ビューメニューからフィルタの作成画面を開きます。
[フィルタ名]に名前を入力し、[フィルタの種類]で[定義済み]を選択します。
3つのプルダウンメニューを次のように指定します。
[フィルタの種類を選択]を[右のみを含む]
[参照元かリンクを選択します] を [ホスト名へのトラフィック]
[式を選択します]を[等しい]
[ホスト名]に「example.com」のように本サイトのドメインを入力します。
[保存]をクリックしてフィルタを作成します。
複数のホストを計測したい場合
計測したいドメインが2つ以上ある場合は、正規表現という記述方法を利用して設定します。
フィルタ名を入力し、[フィルタの種類]で[カスタム]を選択します。
[一致]ラジオボタンをチェックして、[フィルタフィールド]のプルダウンから[ホスト名]を選択します。
[フィルタパターン]は、「example.com または hogehoge.net と一致」という正規表現を入力します。
^(example\.com|hogehoge\.net)$
ドメイン名の記述では example\.com
のように、ドット「.」の直前にバックスラッシュ「\」を入力します。
バックスラッシュの代わりに「¥」の記号も使用できます。
使用している端末の文字変換の環境に合わせて、いずれかの記号を使用しましょう。
複数あるドメインは、間を縦線「|」で区切ります。
記号はすべて半角で入力します。
さらにドメインを追加する場合は、
^(ドメインA|ドメインB|ドメインC)$
というように、カッコ「( )」の中にドメインを縦線「|」で区切って追加していきます。
参考: 正規表現(regex)について – アナリティクス ヘルプ
ホスト名を除外するか、一致させるか、どちらの設定がよい?
Googleアナリティクスでテスト環境へのトラフィックを除外する方法として、「除外」条件を利用する方法と「一致」条件を利用する方法の2通りを紹介しました。
どっちで設定するのがよい?
それぞれの違いは何?
ということを考えてみましょう。
ホスト名を除外する方法は、文字通り、テスト環境へのアクセスを除外するだけなので、本サイトのドメイン以外のその他のホストのデータは計測されます。
対して、ホスト名を本サイトのドメインと一致させる方法は、本サイト以外のトラフィックを全て排除するので、他のホストからのデータは残りません。
よりシンプルに本サイトへのアクセスのみを計測するには、ホスト名を一致させる方法を採用します。
なぜなら、テスト環境のアクセスだけを除外するよりも、除外の適用範囲が広くなるからですね。
テストサイト以外のトラフィックが計測されてしまうケースとは?
では、「本サイトでもなくテストサイトでもない他のホストからのトラフィック」とは一体何なのでしょうか?
それは、Webページのソースを丸々コピーされているケースや、別サイトにページを埋め込まれる(iframe)ようなケースが考えられます。
代表的な例としては、Googleにキャッシュされたページ (webcache.googleusercontent.com) やGoogleで翻訳されたページ (translate.google.com) などがあります。
それから、リファラースパムと呼ばれるスパム行為のデータがあります。

こういったノイズとなるトラフィックデータを一気に除外するならば「ホスト名の一致」によるフィルタを適用する方が簡単ですよね。
『Googleのキャッシュや翻訳ページ、その他のホストへのトラフィックも計測したいものがある』
という事情があるのなら、
- 不要なホストを見つけたら順次除外していく
- 複数のホスト名での一致条件でマッチさせる
といった方法で対応します。
基本的には、本サイトへのアクセスデータがあれば良いと思いますが、それぞれのサイトの方針や考えを元に選択しましょう。
どの方法でやるにしても、全てのアクセスデータを残しておくためのフィルタなしのビューは作成しておくことを忘れずに。
そうすれば、万が一の時でも、データを見ることができますね。
コメントをどうぞ