MT4iと百度(Baidu)クローラの相性問題、mod_securityによるアクセス拒否
MT4i ていう、MovableType が標準で持っていないケータイ閲覧機能を付けることができる CGI スクリプトがありまして、これがちょっと重めな CGI なんですけれども、これで公開されているケータイ用ページが、百度(Baidu)のクローラに取られてしまうと、短時間に集中して MT4i の CGI のプロセスが走ってしまって、ロードアベレージがやたら上がってしまうっていう現象が出てしまったんで、申し訳ないけれども、百度のクローラの User-Agent がきたら 406 出すように設定させてもらいました。
今回いらしたクローラのUser-Agent: Baiduspider+(+http://www.baidu.com/search/spider_jp.html)
どちらかというと、MT4i で展開されたケータイ用ページのリンク先がすべて MT4i を通ることになっているから起きる問題ではありますけれども。
mod_security 入れてある apache の httpd.conf あたりで、
<Files "mt4i.cgi">
SecFilterEngine On
SecFilterScanPOST On
SecFilterDefaultAction "deny,log,status:406"
SecFilterSelective HTTP_USER_AGENT "^Baiduspider"
</Files>
等とすることで対処しました。
(2007-01-12 23:14追記)
たねちゃんズ12: 百度(Baidu)酷過ぎるぞ! [blog.tanechan.jp]
にて、ふつうの apache での Baidu 拒否の方法があります。
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/19018/13459928
この記事へのトラックバック一覧です: MT4iと百度(Baidu)クローラの相性問題、mod_securityによるアクセス拒否:
» 百度(Baidu)スパム超超超大量爆撃
from たねちゃんズ12
あの…これもぉ検索ボットってレベルじゃねぇぞ!これからは百度スパムと呼ばせて頂き... 続きを読む
受信: 2007/02/12 23:13:45
コメント
mod_security windows インストール、設定、
分かんない。ZIP解凍して、モジュールに
移して、 httpd.conf にデフォルトのコピーした。
modsecurity-2.5.9のフォルダの中身はどうする?
フォルダごと、apache2のフォルダに移すのか?
投稿者: たけちゃん (2009/09/11 13:02:14)






![森田 創: WEB+DB PRESS 総集編 [Vol.1~60]](http://ecx.images-amazon.com/images/I/51aE58LxWlL._SL75_.jpg)
















![: 電子ルーペ ViewPe[ビューペ] 3R-MSV35 マイクロスコープ デジタル顕微鏡 高機能 低価格 読書 植物 研究 肌チェック](http://ecx.images-amazon.com/images/I/41erkiQgAsL._SL75_.jpg)





![: Optimus bright [docomo L-07C] 対応 予備バッテリー 1500mAh BL-44JN](http://ecx.images-amazon.com/images/I/41gjqsDjq%2BL._SL75_.jpg)










![: パンツの穴 [DVD]](http://ecx.images-amazon.com/images/I/21R9SEY1HPL._SL75_.jpg)

















