jsのURLにパーマリンクURLを入れて、Webサーバのログでpvを集計する

2007/12/01

■2007/11/30 [デジ埋2007年11月のpv上位リスト
デジ埋2007年11月のpv上位リスト]
 
昨日の記事でもちょっと触れましたが、月に1度カウントしている記事別の
アクセスランキングは、Webサーバの ログから直接集計 しています。
そのため、検索ボットやスパム のアクセスもここに含まれていることになります。
 
上記の記事では、Webサーバのログをソースにすると、月刊のページビュー(PV)は
27万PV ありました。一方で、Google Analytics で見ると 約10万
なっていますので差が17万あります。ところが、User Agentで主な検索ボットなどの
アクセスを数えてみると、せいぜい 3割(8万PV)程度 しかありません。
 
では、もう3割は一体何だったのかと、これがずっと不思議だったのですが、
どうやら推測するに、これは検索ボット以外のスクリプトによるアクセスのようです。
1つには スパマーさんがURL収集のために 使っているスクリプトがあります。
それから、もっと善良なものとしては、Webブラウザの 先読みプラグイン なども
一度に大量のアクセスを発生させる要因になります。これらがいろいろあわさって
残りの3割を占めているのではないかという推測を、今のところはしています。
 
そこでもうちょっと 「人間によるアクセス」 をうまくログに残せないかなと思って、
Google Analytics と同じようにカウント用のjavascriptを1つ噛ませてみることに
しました。方法は至って簡単ですので、ここでご紹介しておきます。
 
 
昨日からこんな 1行のスクリプトタグ を各ページに挟みました。
 
<script language="javascript" type="text/javascript" src="/pvcount/blog/entryurl/(記事のパーマリンク)" charset="EUC-JP"></script>
 
一方で、そのsrcに指定された先のスクリプトはどうなっているのかといいますと、
 
RewriteEngine On
RewriteRule ^pvcount/blog/entryurl/(.*)$ /pvcount/blank.js

 
こんな感じで、mod_rewrite の設定で全部同じ 空の.jsにマッピング してあります。
Webページ上に何も表示されないのはモチロンのこと、処理も何1つ行っていません。
 
つまりこれは、WebサーバのログにパーマリンクURLを刻み込むためだけに
挟み込まれているスクリプトになっています。集計はWebサーバのログから
この形式の行をgrepなり何なりすれば簡単に抜き出せますので、
あとからいくらでも集計することができます。
 
javascriptですので、一般的なボットや先読みスクリプトなどがこのjsを
辿って読んでいく意味はありません。となると純粋に一般的なユーザが
一般的なブラウザで読んだときだけカウントされることになるという寸法です。
ただ、javascriptの実行をオフにしている方や、携帯、テキストブラウザ(w3mなど)からの
アクセスも見えなくなってしまいますので、今度は実際の数字より若干減ってしまうのですが、
少なくともボットなどを全部カウントした数字よりは有効な結果が得られるでしょう。
 
こうした処理をCGIでカウントすると、PVに比例したCGIプロセス起動が必要となり、
サーバ負荷にも影響が出てしまうのですが、このように ログに刻み込むだけ であれば
jsのURLにID(=ここではパーマリンクURL)を含めておいて、その先は全部空のjsに
マッピングするというのは案外といろいろな場面で応用ができそうです。
 
来月からのランキング集計は早速この数字を使ってみたいと思います( ・ω・)


2007/12/01 [updated : 2007/12/01 23:59]


この記事を書いたのは・・・。
CK@デジモノに埋もれる日々 @ckom
ブログ「デジモノに埋もれる日々」「アニメレーダー」「コミックダッシュ!」管理人。デジモノ、アニメ、ゲーム等の雑多な情報をツイートします。




« デジ埋2007年11月のpv上位リスト

トップに戻る

Forza2でウィリー! 定番のCarreraセッティングから、禁断のバック・ウィリーまで »


▼ はてなブックマークのコメント ▼



2024年のご挨拶


全力Vの1年:2023年振り返り~2023年も大変お世話になりました。2024年も宜しくお願いいたします。


2023年あけましておめでとうございます。デジモノに埋もれる様子をお届けできない日々


"V"にハマった1年:2022年振り返り~2022年も大変お世話になりました。2023年も宜しくお願いいたします。


(状況のご報告)Twitterアカウントの状況について ※2022.11.08追記あり


連投メモ:「ツイートで『ブログ』を書く」お話と、ガジェット系からイベントレポ系に遷移していった時のお話


2022年あけましておめでとうございます。よろず話はカーナビの「ジャイロ」ご乱心のお話


2021年も大変お世話になりました。2022年も宜しくお願いいたします。


2021年あけましておめでとうございます。よろず話はレンタカーと「一脚」テスト。


2020年も大変お世話になりました。2021年も宜しくお願いいたします。


2020年あけましておめでとうございます。今年はちゃんと歯を磨きます。。。


2019年も大変お世話になりました。2020年も宜しくお願いいたします。

ピックアップタグ




ブログ内検索



▼ コメント ▼


★コミックダッシュ! 10,000人突破ありがとうキャンペーン!(9/18~10/23)
 
デジモノに埋もれる日々 : (C) CKWorks