• 締切済み

namazuのインデックス作成で・・・

現在、htaccessにてphpファイルをhtml拡張子で使えるようにして利用しているディレクトリがあります。 そのhtmlは大量にありそれぞれ内容は違いますが、ヘッダ、フッタ部分は共通ファイルをインクルードしているので同じになっています。 インクルードファイルは、ヘッダ、フッタ共に静的なhtmlで、本体自体もインクルードの記述部分以外は静的なhtmlです。 <html> <?php include('header.html'); ?> <body> ~ ここが各htmlによって内容が違う ~ <?php include('footer.html'); ?> </body> </html> という構造になっております。 このhtml群をnamazuを使ってディレクトリ内の全文検索を行えるようにしようかと考えているのですが、上述のようなhtmlの場合、インクルードされるheader.htmlやfooter.htmlに書かれている内容はインデックスされるのでしょうか? インデックスさせる・させない の選択がnamazuの設定によって出来るのであれば一番ありがたいのですが・・・。 宜しくお願い致します。

みんなの回答

回答No.1

mknmzはhtmlやphpを解釈しません。 ファイル単位でインデックス対象を選択してください。 --target-list=FILE インデックス対象のファイルのリストを読み込む --allow=PATTERN 対象とするファイル名の正規表現を指定する --deny=PATTERN 拒絶するファイル名の正規表現を指定する --exclude=PATTERN 除外するパス名の正規表現を指定する

gogo-tea
質問者

お礼

回答ありがとうございます。 ・header.html、hooter.htmlはそれぞれのファイルとしてインデクスされ、それ以外の本体htmlが何らかのキーワードで検索にひっかかったとしてもインクルードされる部分に含まれる文字列の表示はされない。 ・インクルード部分にのみ含まれる文字列で検索をかけても本体html自体は検索にひっかからない。 ということでよろしいでしょうか?

gogo-tea
質問者

補足

すみませんお礼欄に書いた確認の補足です。 各本体htmlには <?php include('header.html'); ?> や <?php include('footer.html'); ?> が書かれているのですが、この文字列自体もインデックスされてしまうのでしょうか? 例えば"<?"や"include"などをキーワードにして検索した場合、本体html全てが検索にひっかかってしまうとか・・・。 もしそうなってしまう場合、allow、denyでディレクトリやファイルのフィルタをするような要領で文字列のフィルタリングも可能なのでしょうか?

関連するQ&A

専門家に質問してみよう