Amazon商品の価格変動チェック「あまとも」
コミックダッシュ!は初音ミクGTプロジェクトを応援しています
個人ニュースサイトを巡回する「メガとんトラック」
全ての記事 携プレMP3 デジカメ レコーダ ゲーム メモリ デジモノ コラム 雑談 ブログ あまとも コミックダッシュ!
前の記事次の記事
2007/12/01 23:59 - 2007/12/01

jsのURLにパーマリンクURLを入れて、Webサーバのログでpvを集計する

カテゴリ : ブログ タグ :

    ■2007/11/30 [デジ埋2007年11月のpv上位リスト]
     
    昨日の記事でもちょっと触れましたが、月に1度カウントしている記事別の
    アクセスランキングは、Webサーバの ログから直接集計 しています。
    そのため、検索ボットやスパム のアクセスもここに含まれていることになります。
     
    上記の記事では、Webサーバのログをソースにすると、月刊のページビュー(PV)は
    27万PV ありました。一方で、Google Analytics で見ると 約10万
    なっていますので差が17万あります。ところが、User Agentで主な検索ボットなどの
    アクセスを数えてみると、せいぜい 3割(8万PV)程度 しかありません。
     
    では、もう3割は一体何だったのかと、これがずっと不思議だったのですが、
    どうやら推測するに、これは検索ボット以外のスクリプトによるアクセスのようです。
    1つには スパマーさんがURL収集のために 使っているスクリプトがあります。
    それから、もっと善良なものとしては、Webブラウザの 先読みプラグイン なども
    一度に大量のアクセスを発生させる要因になります。これらがいろいろあわさって
    残りの3割を占めているのではないかという推測を、今のところはしています。
     
    そこでもうちょっと 「人間によるアクセス」 をうまくログに残せないかなと思って、
    Google Analytics と同じようにカウント用のjavascriptを1つ噛ませてみることに
    しました。方法は至って簡単ですので、ここでご紹介しておきます。
     
     
    昨日からこんな 1行のスクリプトタグ を各ページに挟みました。
     
    <script language="javascript" type="text/javascript" src="/pvcount/blog/entryurl/(記事のパーマリンク)" charset="EUC-JP"></script>
     
    一方で、そのsrcに指定された先のスクリプトはどうなっているのかといいますと、
     
    RewriteEngine On
    RewriteRule ^pvcount/blog/entryurl/(.*)$ /pvcount/blank.js

     
    こんな感じで、mod_rewrite の設定で全部同じ 空の.jsにマッピング してあります。
    Webページ上に何も表示されないのはモチロンのこと、処理も何1つ行っていません。
     
    つまりこれは、WebサーバのログにパーマリンクURLを刻み込むためだけに
    挟み込まれているスクリプトになっています。集計はWebサーバのログから
    この形式の行をgrepなり何なりすれば簡単に抜き出せますので、
    あとからいくらでも集計することができます。
     
    javascriptですので、一般的なボットや先読みスクリプトなどがこのjsを
    辿って読んでいく意味はありません。となると純粋に一般的なユーザが
    一般的なブラウザで読んだときだけカウントされることになるという寸法です。
    ただ、javascriptの実行をオフにしている方や、携帯、テキストブラウザ(w3mなど)からの
    アクセスも見えなくなってしまいますので、今度は実際の数字より若干減ってしまうのですが、
    少なくともボットなどを全部カウントした数字よりは有効な結果が得られるでしょう。
     
    こうした処理をCGIでカウントすると、PVに比例したCGIプロセス起動が必要となり、
    サーバ負荷にも影響が出てしまうのですが、このように ログに刻み込むだけ であれば
    jsのURLにID(=ここではパーマリンクURL)を含めておいて、その先は全部空のjsに
    マッピングするというのは案外といろいろな場面で応用ができそうです。
     
    来月からのランキング集計は早速この数字を使ってみたいと思います( ・ω・)

    CK@デジモノに埋もれる日々 @ckom
    ブログ「デジモノに埋もれる日々」「アニメレーダー」「コミックダッシュ!」管理人。デジモノ、アニメ、ゲーム等の雑多な情報をツイートします。



    投稿者 CK : 記事URL | ブログ | | 2007/12/01 23:59


    « デジ埋2007年11月のpv上位リスト

    トップに戻る

    Forza2でウィリー! 定番のCarreraセッティングから、禁断のバック・ウィリーまで »



    ▼ コメント ▼

    ご自由にコメントください(=゜ω゜)ノ  ▼ コメント入力欄を開く ▼
    ※管理人は多忙のためお返事はほとんどできません(スミマセン)。
    スパムおよび本文と無関係なコメントは削除対象になる可能性があります。


    ▼ はてなブックマークのコメント ▼


    ▼ トラックバック ▼

    このエントリーのトラックバックURL:

    このリストは、次のエントリーを参照しています: jsのURLにパーマリンクURLを入れて、Webサーバのログでpvを集計する:

    トラックバック時刻: 2007年12月 7日 23:53

    » 【アクセスアップ】 アクセス安定していますね from 1日1Blog。eブログ作成情報局,jsのURLにパーマリンクURLを入れて

    アクセスランキングが

    安定した数値で推移。

    [続きを読む]

    ★コミックダッシュ! 10,000人突破ありがとうキャンペーン!(9/18~10/23)
     
    デジモノに埋もれる日々 : (C) CKWorks