« 検索サイトから消す | トップページ | 先祖返り?(lynx) »

2006年10月14日 (土)

Googlebotのアクセスを捕まえたい

今使っているアクセス解析は、前に載ってるように<script>タグを認識したらdocument.writeでスクリプトがOFFなら<noscript>内で<img>を使ってCGIへアクセスしてIPやUserAgentをチェックしていると検索サイトの巡回ロボットはinktomisearch.com(Yahoo)しか捕まえられていません。

Googleのロボット(Googlebot)ぐらいは見つけたい。ということで(Googlebotのアクセスがわかったからと何も無いのですが、やっぱり知りたい。ただそれだけ)

検索ロボットを捕まえるタグってのを教えてくれるサイトがあるそうですが、登録とかをものすごく面倒に思うので、そこに頼るのは止めて(気になる方はhttp://goukou.com/blog/archives/001045.html)他のタグを使ってみようと思います。
とりあえず、強制的に読み込むタグでスタイルシートの指定。一応<head>内限定らしいですが、<body>に入れてページを読み込んでみたところ、とりあえずファイルを読みに行くみたいなので、<body>に入れてしばらく放置。

でも当然だめ。探し回った挙句、結局CGIへのリンクを作りました。リンクをたどるので、拡張子がCGIだから無視する。とか言うのじゃなければ少なくともそのリンクをたどろうとしたことは判るはず。で、またまたやってみました。
今度はちゃんとgooglebotを捕まえられました。今のところこれしかないようです。

ただ、リンクは見てる人がクリックしてしまうことがあるのとそのリンクを無視されたらどうしようもないのと、ロボットはリファラー全然返してくれないのですよね。inktomisearch.comを見ていると必ずリンクを見に行っているわけじゃないようです。googlebotもホントはもっと頻繁に来てるかもしれませんが

|

« 検索サイトから消す | トップページ | 先祖返り?(lynx) »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/46744/3804855

この記事へのトラックバック一覧です: Googlebotのアクセスを捕まえたい:

« 検索サイトから消す | トップページ | 先祖返り?(lynx) »