はてなBookmarkに登録

百度(baidu)のクローラーはお断り

ITメディアのオルタナティブ・ブログに、ウェブサイトのヒット数が突如何倍にもに急増する魔法にかかった?という記事がありましたが、この記事同様にウチにもbaiduのクローラーが頻繁に来るようになりました。幸いなことにサーバが落ちることは有りませんでしたが、それでもデータ転送量が倍くらいに増えています。いつ頃から来るようになったのかは忘れてしまいましたが…。

百度のクローラーですが、この記事にあるように行儀悪くガンガン連続してアクセスして来ますし、robots.txtは無視してくれましたし、何より中国の検索サイトでウチのサイトが検索されても嬉しくも悲しくも何ともないので、ルータレベルでお引き取り頂くことにしました。サーバ側(iptablesやapache)で拒否する方法も有りますが、サーバのリソースを使うのももったいないので。

で、百度からのアクセスをdropするようにして1週間以上経過しましたが、ルータのログを見ると未だにしつこくアクセスして来ています。こういう点もお行儀が悪いなぁ…。

百度では日本語のサービスも始めるみたいですが、もう少しお行儀を良くしないと、皆さんから嫌われてしまって、サービスに影響が出るかもしれません。
投稿者 Izumi : 22:30 | PC / Net

トラックバック

このエントリーのトラックバックURL:
http://www.simazaki.com/~izumi/cgi-bin/tt-cgi/tt_tb.cgi/414

写真のヘレンとはとりあえず関係ないと思われる話題なのだが、最近中国からのアクセスがやたらに多い。XteleのHPはサクラのレンタルサーバーを使用しているのだが、これにはWebalizer と言うログ解析ソフトが勝手...

ヘレンのBlog ... 雪遊び : 2007年1月17日 17:03

行儀の悪いクローラのアクセスを禁止するで全信協のクローラにアク禁を出したのが一か月前。今度は別のが来ていたので、仕方なく拒否ルールを増やしました。UserAgentは「Mozilla/...

Charlie's volatile short : 2007年7月11日 21:51

コメント

コメントしてください




保存しますか? はいいいえ


 
< 2007年1月 >
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      
サイト内検索
Recent Comments
Recent Trackback
リンクリスト