2004年4月15日 00:49

namazu 2.0.13 リリース

スポンサードリンク

ソースは slashdot japan(/.j) ですが、namazu 2.0.13 が公開されています。

俺と namazu

昔いたサークルの顧問の先生がそんな名前でした。

―― 一貫の終わり ――

俺と namazu（第２話）

うちで、全文検索システムを入れたくなったとき、namazu を見つけて、RedHat7.2 に入れました。当時は rpm の2.0.10のパッケージだったと思いますが、けっこう苦労した気もしなくもないけれども、なんとか入りました。

PDF を検索対象にしたくなったので、xpdf を入れてごにょごにょしたりという面倒もありますが、結構なんとかなるものです。PDF も検索対象にできました。

実際使っていると、インデックス生成に時間がかかるのでちょっとストレスがたまるということで、Pentium 133MHz + RedHat7.2 + 15GB HDDx2 が Duron 1.4GHz + RedHat 8 +40GB HDDx2 に、なけなしのお金を伴い化けてしまいました。

また、PDF が検索できるということで、PFU の ScanSnap! を買ったり、読んで！ココで透明テキスト付き PDF を作ったり、いよいよ大変なシステムになっていきましたとさ。

俺と namazu（第３話・最終回）

某所で、Web の全文検索を提供しようということになって、namazu を入れてみました。

namazuの基本的な機能は、

ファイルシステムの中の一部のディレクトリの中の文書を読みだし、インデックスファイルを別のところにつくっておくこと、
検索時は cgi から、インデックスファイルを利用して文書の位置をパスで表示。その時、サーバ内の絶対パスで表示しても意味ないので、先頭のところを http://～と置換する。

ということになっています。だから、namazuを設置したサーバに、wwwサーバのディレクトリがファイルシステムとしてマウントできない環境では、wgetしてきて、そいつをインデックス化する必要があります。そして、ここのシステムがまさに、wwwサーバとnamazuのサーバが別アーキテクチャのサーバだったのです。

wgetする。→mknmzする。→wgetしたのを消す。

つうのを cron で仕組まなければいけません。ここに来て、とても重要なことに気付きました。namazu は、全文検索システムの部品のひとつであると。

というわけで、「メンドウ」という評価が下され、代わりに HP の mitake search というのがあるよ、というのを教えられました。

こっちの方が非常に使いやすい。インストールも楽チン。

―― 一貫の終わり ――