M.C.P.C.

―むり・くり―プラスコミュニケーション(更新終了)


| トップページ |

2007年1月12日 22:42

MT4iと百度(Baidu)クローラの相性問題、mod_securityによるアクセス拒否

このエントリーをはてなブックマークに追加 mixiチェック

MT4i ていう、MovableType が標準で持っていないケータイ閲覧機能を付けることができる CGI スクリプトがありまして、これがちょっと重めな CGI なんですけれども、これで公開されているケータイ用ページが、百度(Baidu)のクローラに取られてしまうと、短時間に集中して MT4i の CGI のプロセスが走ってしまって、ロードアベレージがやたら上がってしまうっていう現象が出てしまったんで、申し訳ないけれども、百度のクローラの User-Agent がきたら 406 出すように設定させてもらいました。

今回いらしたクローラのUser-Agent: Baiduspider+(+http://www.baidu.com/search/spider_jp.html)

どちらかというと、MT4i で展開されたケータイ用ページのリンク先がすべて MT4i を通ることになっているから起きる問題ではありますけれども。

mod_security 入れてある apache の httpd.conf あたりで、

<Files "mt4i.cgi">
    SecFilterEngine On
    SecFilterScanPOST On
    SecFilterDefaultAction "deny,log,status:406"
    SecFilterSelective HTTP_USER_AGENT "^Baiduspider"
</Files>

等とすることで対処しました。


(2007-01-12 23:14追記)

たねちゃんズ12: 百度(Baidu)酷過ぎるぞ! [blog.tanechan.jp]

にて、ふつうの apache での Baidu 拒否の方法があります。

投稿 大野 義貴 [Web] | |

トラックバック(1)

トラックバックURL: http://blog.dtpwiki.jp/MTOS/mt-tb.cgi/1944

あの…これもぉ検索ボットってレベルじゃねぇぞ!これからは百度スパムと呼ばせて頂き... 続きを読む

コメント(1)

mod_security windows インストール、設定、
分かんない。ZIP解凍して、モジュールに
移して、 httpd.conf にデフォルトのコピーした。
modsecurity-2.5.9のフォルダの中身はどうする?
フォルダごと、apache2のフォルダに移すのか?

コメントする