Namazu/ ホームページに全文検索機能を持たせたい場合
PDFDocText? v1.21 ★★★
PDFファイルをテキストに変換するツールです。
テキスト変換はページ・ファイル単位で行うことができます
http://homepage3.nifty.com/e-papy/p2.html
■mknmzrcの変更 まずmknmzrcの内容を変更しましょう。
基本的にはコメントアウト(行頭に#)されている記号(#)を外し、設定を有効にするだけです。
# Administrator's email address
#
# $ADDRESS = 'webmaster@foo.bar.jp'; <--行頭の#を外し、あなたのメールアドレスに変更します
# This pattern specifies HTML suffixes.
#
# $HTML_SUFFIX = "html?|[ps]html|html\\.[a-z]{2}"; <--行頭の#を外します
$HTML_SUFFIXはhtmlやhtm、shtml、html.jaなどhtmlファイルとして認識するファイルを定義しています
など
■namazurcの変更 namazurcはnamazuコマンドの動作に関する内容を記述します。
Search-S for namazuを使ってLocalのPC内の文書を検索する場合は特に内容を書き換える必要はありません。
通常、namazurcの設定がが必要になるのはapacheなどWeb ServerでNamazuをCGI(namazu.cgi.exe)として動作させる際に
namazurcをドット付きの.namazurcにリネームして/cgi-binディレクトリなどに置いて使用するケースです。
namazurcの設定を確認するにはMS-DOSプロンプトでnamazu -Cを実行します。
C:\WINDOWS>namazu -C
■インデックスの作成 mknmzrcの変更が完了したら、実際に検索対象とするファイルを用意してインデックスを作成してみましょう。
まず、適当な内容のtextかhtmlファイルを用意します。
検索対象(C:\docs)というディレクトリを作成する前提で進めます。
DやEといったドライブでも構いません。
次に作成したインデックスを格納するディレクトリを用意します。
Namazu標準のC:\namazu\var\namazu\indexを使う場合は新たに用意する必要はありません。
(C:\nmzindex)を作成するという前提で進みます。
準備ができたら実際にインデックスを作成してみましょう。
mknmz -O C:\nmzindex C:\docsと入力し、Enterキーを押します。
- Oはインデックスのoutput先を指定す、続くC:\nmzindexがインデックスの書き込みディレクトリ。
次のC:\docsが検索対象になる文書が置いてあるディレクトリです。
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 20
ファイル/秒: 0.10
システム: MSWin32
Perl: 5.006001
Namazu: 2.0.12
のように表示されてmknmzが終了し、プロンプトが点滅した状態に戻れば、インデックスの作成は成功です。
なお、mknmzはC:\namazu\etc\namazu\mknmzrcを設定ファイルとして読み込むはずですが、
何らかの原因でC:\namazu\etc\namazu\mknmzrcが読み込まれず、
大元の設定ファイルであるC:\namazu\share\namazu\pl\conf.plが読み込まれてしまうことがまれにあるようです。
その場合は
mknmz --config=C:\namazu\etc\namazu\mknmzrc -O C:\nmzindex C:\docs
と設定ファイルの居場所を明示すればOKのはずです。
ディレクトリC:\nmzindexを見てみましょう。合計54個のファイルが生成されているはずです。