• 締切済み

【namazu全文検索】ファイル名(URL)の長さについて

はじめまして。 namazuを使って文書内検索を行っています。 検索対象の文書ファイルは日本語のファイル名でもOKなのですが、日本語のファイル名だとどうしてもindex作成時にエンコードした(された)時に保存先までのURLが長くなってしまい、NAMAZU.field.uriにファイル名が最後まで入りきっていませんでした。 なので、文書を検索したときヒットはするのですが、文書のリンクをクリックしても「ページが表示できません」となってしまいます。 インターネットで調べたところ、mknmzrcの$MAX_FIELD_LENGTHの値を変えればよいとあったので、変えてインデックスを作成しなおしたのですが改善されず。 また、そのサイトとは別のサイトで調べると$MAX_FIELD_LENGTHは要約文の長さと説明してありました。 ファイル名(URL)の長さをnamazuの設定で変えることは可能でしょうか?その場合、どこで設定すればよいでしょうか? ご存知の方がいらっしゃいましたらご教授願います。 宜しくお願い致します。

noname#18658
noname#18658

みんなの回答

  • tmasao
  • ベストアンサー率0% (0/2)
回答No.1

結果的にURLの長さは何文字くらいになっているのでしょうか? BUFSIZE 1024バイト以上になっていると切り詰められる気がしますが。 ソースコードからいじる環境があるなら、libnamazu.h にある BUFSIZE を増やすとよいと思いますが。

noname#18658
質問者

お礼

ありがとうございました。 頂いた回答とは別の方法で解決しました。 ちなみに、解決方法は・・・ alloca.cの262行目の long ss[0200]; /* 0200 overflow words. */ の[0200]を任意の長さ(私の場合は[0600])に書き直した後、 namazuをコンパイルし、 conf.plの$MAX_FIELD_LENGTHを、 $MAX_FIELD_LENGTH = 600; alloca.cで指定した長さ(この場合600)に修正してインデックスを 作成しなおすことで解決しました。 本当にこのやり方で正しいのかどうかはわかりませんが… 回答していただき、ありがとうございました。

関連するQ&A

  • Namazuによる全文検索について

    VineLinux2.6+samba+namazu+apacheで、ファイルサーバをつくり、webブラウザからnamazu.cgiを使ってファイルサーバ内のファイルを全文検索しています。 検索は問題なく出来るのですが、ヒットしたファイルが日本語のファイル名だと、ブラウザ上に表示されているファイル名をクリックしてもファイルをオープンしません。英数字のファイル名であれば、word、excel、txtを問わず、開くことが可能です。また、ブラウズはネスケだとブラウザ上にバイナリーをそのまま表示したようになります。IEだとページが見つかりませんと表示されています。 解決策をおしえてください。

  • 全文検索NAMAZUを複数設置するには?

    Namazuを2つ(Namazu1:Index1/ Namazu2:Index2)設置しようと試みましたが、下に示すそれぞれの検索画面を開くと、find1, find2のnamazurcの設定を正しく読んでくれません(説明書によると、*.cgiと同じディレクトリにあるnamazurcを設定ファイルとして読み込むとありますが・・・) まずTemplateですが、デフォルトのIndex(F:\namazu\var\namazu\index)を読み込んでしまい、find1,2内のtemplateを読み込んでくれません。次にIndexですが、i_search/namazu.cgi.exeを開くと、自分の設定を正しく読んでくれますが(ただし試験的にキーワードを検索しても結果画面に現れない)、w_search/namazu.cgi.exeを開くと、i_search/namazu.cgi.exeと同じ検索画面が出てくることから、自分のIndex設定を正しく読み込んでいないようです。 自分なりに原因を探る中で、環境変数のNAMAZURCと、ファイルF:\namazu\etc\namazu\namazurc、ファイルF:\namazu\etc\namazu\mknmzrc内の最終行にある$TEMPLATEDIR = 'F:/namazu/share/namazu/template';の文字列の3点を削除しました。ビギナーなりに過去ログを読んだり、いろいろ試しましたが、どうも上手くいきません。原因についてこころあたりの方、ご助言いただきたくお願い申し上げます。 ■WEBサイト検索(http://192.168.1.1/w_search/namazu.cgi.exe)file数652 F:\namazu\find1\ index\ template\ namazu.cgi.exe namazurc ■iModeページ検索(http://192.168.1.1/i_search/namazu.cgi.exe)file数10 F:\namazu\find2\ index\ template\ namazu.cgi.exe namazurc ■環境 Windows 2000 Server + IIS 5.0 + IE 5.50 Namazu 2.0.10 kakasi-2.3.4 Perl, v5.6.1

    • ベストアンサー
    • CGI
  • 全文検索Namazuのインデックス作成について

    OS:Windows2000SP4 namazu:Namazu 2.0.14 はじめまして。 Windows版のNamazuを入れたのですが インデックスの作成にてこずっています。 インデックス作成は出来るのですが、 ディレクトリに%がつくものが作成されており、検索するとリンクエラーになってしまいます。 ご存知の方ご教示宜しくお願いします。

  • namazu全文検索について、どなたか教えてください。

    namazu全文検索について、どなたか教えてください。 結論から述べますと、検索した際に英単語と日本語が重なったキーワードがヒットしません。 専門的な単語なのでヒットしないのでしょうか? ちなみに、検索したい英単語に「*」をつけて検索した場合、英単語だけの場合はヒットするのですが、英単語と日本語が重なったものについては、ヒットしません。 どなたか原因や対処方がわかる方教えていただけないでしょうか?

  • Namazuのインデックスについて

    Namazuのインデックスを作成したいのですが、 Aサーバでインデックスを作成して、 Bサーバにそのインデックスを持ってきて利用したいです。 A,Bの状況は、 A,B共にhttpサーバです。 ディレクトリが A  http://www.AAA.com/namazu/"検索させたいサイトデータ" B  http://www.BBB.com/"検索させたいサイトデータ" のようになり、A,B共に同じ"検索させたいサイトデータ"を設置します。 このような場合、 Aサーバでmknmzを実行するときにコマンド引数で "--replace=CODE" を使いURIを置き換えて、作成されたインデックスファイルを Bサーバに持ってきてnamazu.cgiで検索する という感じで可能でしょうか。

    • 締切済み
    • CGI
  • Namazu+xpdfでPDFファイルを検索した時の不具合

    Windows2000 ServerにNamazu+xpdfを入れて、 検索機能を実現しているのですが、 あるキーワードで検索したら、 キーワードが全く入っていないPDF文書が 出てきたりするのですが、 これを直す方法はどのようにすればよろしいでしょうか? 例えば、 Namazuで「更新状況」というキーワードで検索かけたとします。 そうすると、PDFファイルが1つ見つかったとします。 しかし、そのPDFファイルを開いて、Acrobatの機能で、さきほどのキーワード(更新状況)を 検索しても、「見つかりませんでした」と表示されてしまいます。 今度は、「更新」の部分を削って、「状況」だけをAcrobat上で検索すると、 その文字は見つかりました。 ということは、Namazu+xpdfでは、「更新状況」という文字を 「更」「新」「状」「況」という風に、 一文字ずつ区切って、検索しているのでしょうか? それはどこかの設定で変更することは可能なのでしょうか? 分かりにくい文章で申し訳ありませんが、 どなたか、ご教授ください。 おねがいします。

  • namazu のインデックス作成

    No.313463,No.314412の続きです。 namazu,kakasi,perlは無事インストールできたのですが、インデックスの作成がうまくいきません。 MS-DOSプロンプトで C:\mknmz -O C:\namazu\var\namazu\index C:\homepage  と入力しましたが「コマンドまたはファイル名が違います。」と表示されます。 どこがおかしいのでしょうか? ソフトは nmz2010 ActivePerl-5.6.1.633-MSWin32-x86 kakasi-2.3.4 です。 FMV-BIBLOを使っています。 OSはwindows98 関連URL:http://oshiete1.goo.ne.jp/kotaeru.php3?qid=313463 http://oshiete1.goo.ne.jp/kotaeru.php3?qid=314412

  • namazu 検索窓の設置について

    お世話になります。 namazuの検索窓の設置について質問させて下さい。 現在An Httpdサーバを入れ、自分のPCから http://マイPC IPアドレス/cgi-bin/namazu.cgi.exe ではNamazuの検索は正常に動作しております。 namazu.cgi.exeファイルをnamazu.ccgiファイルに 名前を変え、検索窓を設置し検索すると "ファイルのダウンロード"のウィンドウが表示され 検索出来ません。 <!--Namazu による全文検索システム--> <form action="/cgi-bin/namazu.ccgi" method="get"> <p> <input name="query" value="" size="30" accessKey="T" tabIndex="10"> <input type="hidden" name="whence" value="0"> <input type="hidden" name="max" value="20"> <input type="hidden" name="result" value="normal"> <input type="hidden" name="sort" value="score"> <input type="hidden" name="idxname" value="pub,past"> <input type="submit" value="検索" accessKey="S" tabIndex="11"> </p> </form> どの様に設定変更すればいいのか教えて欲しいです。 よろしくお願いします。 An Httpdのセットアップは下記サイトを参考にしました。 http://www10.plala.or.jp/miyazawa/namazu/anhttpd.html

    • ベストアンサー
    • CGI
  • ◆cronでNAMAZU検索実行

    いつもお世話になっています。 全文検索NAMAZUを自サイトに組み込みました。 mknmzコマンドを実行してindexを作成する際の質問です。 linux上で直接コマンドを実行すると問題ないのですが、cronを実行させて コマンドを実行すると、NMZ.w(検索キーワード)内の単語の取得が上手く出来ていません。 cronを通すとKAKASIが上手く動作しないようです。 実行したコマンド cron----------------------------- #!/bin/sh cd /root/www/namazu/ mknmz -k -U -O /root/www/namazu/ . cron----------------------------- シェルスクリプト----------------- */30 * * * * /root/www/namazu/namazu.sh シェルスクリプト----------------- 何かご存知の方がいれば宜しくお願いいたします。

  • 全文検索プログラムを作りたい!

    今度、仕事で全文検索を行うプログラムを作ることとなりそうです。 もちろん日本語対応で、WordやExcelファイル内の文字列を検索する仕様です。 しかし、どのような方法でプログラムを作るのかチンプンカンプンです。 とりあえず今時点でわからないところが3つほどあります。 全文検索の技術に精通している方いましたら、是非アドバイスお願い致します。 (1).全文検索するAPI関数ってないでしょうか?   もしくは、ネット上でフリーで配布されている全文検索する   プログラムってないでしょうか? (2).全文検索するプログラムを作るのに適した   プログラム言語って何でしょうか? (3).市販されている全文検索システムは、インデックスファイルを作成し、   そのインデックスファイルから全文検索をしているようですが、   インデックスファイルを用意するメリットって何でしょうか?