リファラースパムとは

アクセス解析をチェックする人が見ている項目の1つに「他サイトから流入したユーザーのリンク元はどんなサイトか」というものがあります。それを知るために、Googleアナリティクスで計測された参照元のURLに実際にアクセスしてみることがあります。

これを逆手にとって、アクセスを増やしたいサイトのアドレスが参照元に残るようなデータを多数のGoogleアナリティクスアカウントに送信するスパム行為をリファラースパムと言います。これらのリファラースパムのデータは正常なアクセスではないため、平均ページビュー数やサイト滞在時間といった指標に異常値を発生させる要因となります。特にアクセス数の少ないサイトでは、リファラースパムのアクセス比率が高くなってしまい、異常な数値となってしまうことがあります。

リファラースパムはどうやっているのか?

現在のGoogleアナリティクス(通称、ユニバーサル・アナリティクス)では、Measurement Protocolと呼ばれる方法でGoogleアナリティクスに対してページビューデータを送信することができます。これは、ブラウザでサイトを読み込むことなく、プログラムから直接ページビューデータを送信することができる仕組みで、これを使うと短時間に多数の偽造したページビューデータを送信することもできます。

実際に、下記のURLをコピーして、「UA-12345678-99」の箇所をご自身のプロパティIDに変更してアクセスしてみてください。該当のGoogleアナリティクスのリアルタイムビューを見ると、/ReferrerSpam.htmlというページへのアクセスが発生すると思います。

https://www.google-analytics.com/collect?v=1&tid=UA-12345678-99&cid=555&t=pageview&dh=example.com&dp=/ReferrerSpam.html&dt=ReferrerSpam

また、プロパティIDをどのように特定しているのか疑問に思う方もいるかと思いますが、「UA-1-1」から「UA-9999999-1」まで無差別に試す、という方法を行っているように思います。実際、サイトにタグを設置していないプロパティにもリファラースパムはやってきますし、プログラムでページビューデータを送信するので、プロパティ数が増えても手間はほとんどかかりません。

一般的な対策法

一般的な対策法としては、リファラースパムのデータを解析して、共通して見られる特徴を抜き出して、ビューのフィルタ設定に投入していく方法があります。ただし、この方法では新たなリファラースパムが発生する度にフィルタを追加していく必要があります。最近では、参照元にデータを残すのではなく、ページURLや、イベントデータ、検索キーワードなどにデータを残す亜種も出てきています。

また、間違ったフィルタを設定してしまい、本来は除外するべきではないアクセスまで除外してしまうリスクも持っています。

劇的にリファラースパムを減らす裏技

非常に単純な方法になります。

通常、Googleアナリティクスのタグを設置する際は、管理画面からアカウントとプロパティを作成し、タグを生成していると思います。このタイミングで、作られたプロパティは敢えて利用せずに、もう1個プロパティを作成してください。そして、実際にサイトに設置するときは2つ目のプロパティを利用してください。

最初に生成されたプロパティのIDは、「UA-123456-1」のようになっていると思いますが、2つ目のプロパティIDは「UA-123456-2」になっています。

どうやら、現状のリファラースパムはどれも枝番が1のプロパティに対してしか実行していないようなので、枝番1のプロパティは捨てて、2のものを使うようにしてあげれば、解決してしまう、という非常に単純な方法です。

実際、この考えをもとにして、1月以降の5ヶ月間に渡って運用しているGoogleアナリティクスアカウントがあります。そのアカウントにおいては、枝番が2以降のプロパティに対しては、リファラースパムと思われるデータはほぼ流入していません。逆に枝番が1のプロパティについては、どのページにもタグを設置していないにも関わらず、5ヶ月で1,500セッションのリファラースパムを計測しています。

まとめ

今回見つけた方法は、すでに長年運用してきたGoogleアナリティクスアカウントに対して実施するのは難しい面がありますが、新しくGoogleアナリティクスを設置するタイミングや、設置してから間もないサイトでは非常に有効かつ、フィルタ設定のような面倒な作業は必要ありません。ぜひ、今回の方法を活かすことができる場面がありましたら、実施してみてください。

とはいえ、今回の方法もスパム側が2以降の枝番に対しても対処してしまったら、使えなくなってしまいます。なので、抜本的な対策が必要です。抜本的な対策については、既に有効そうな案があり、現在実験中ですので、様子をみて問題なさそうであれば、また公開いたします。