• ベストアンサー

たまった「pdfファイル」の中から検索する方法

何人かでネットワークで共有しているPCがあります。 そのPCの中には、いろいろなデータやキーワードを含むpdf文章(pdfファイル) が入っています。 フォルダはきってあるものの、年々、蓄積される文章が多くなり探し出す のがとても大変になってきました。 そこで、検索バーに検索文字を入れるとPC内を検索して表示してくれる ものを作成したいのですが、どうしたらいいのかよくわかりません。 ちょうど、検索Googleのイメージです。(そんなたいそう素晴らしいもので なくともよいのです) 1つのWEBとしての検索システムを作り上げるために検索バーの出し方と検索機能 の実現の方法を教えて下さい。 自分のPC内だけなら「pdfTrans」等のソフトがあるのでいいと思うのですが これがデータベースとなると手も足もでません。 どなたかサンプル交えて教えて下さい。 お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • PCFREAK
  • ベストアンサー率51% (417/805)
回答No.2

何人かで共有するという事ですのでnamazuが良いかと思います。 namazuは日本語全文検索システムで、動かすにはちょっと手順(IISやPerlなど)が大変ですが、共有PC(サーバー)上にセットアップしてしまえば、各自のPCのブラウザのみで使用できます。 ちょうどGoogleでインターネットを検索しているのに似ています。 セットアップ方法について参考になりそうなURLを載せておきますね。

参考URL:
http://www10.plala.or.jp/miyazawa/namazu/
myfrend
質問者

補足

PCFREAKさん、どうもありがとうございます。 「namazu」の日本語全文検索システムは使えそうかなという感触です。 ただ、共有PCからの参照の方法が問題なのです。 共有PCからは、htmlファイル(いうなればHP)から検索窓を出して 入力した検索キーを実行する「namazu」をどう走らせるかです。 どうか、アドバイスお願いします。

その他の回答 (5)

  • PCFREAK
  • ベストアンサー率51% (417/805)
回答No.6

>ただ、共有PCからの参照の方法が問題なのです。 >共有PCからは、htmlファイル(いうなればHP)から検索窓を出して >入力した検索キーを実行する「namazu」をどう走らせるかです。 namazuで出来ますけど? まさにnamazuはサーバー上のHTMLから実行されるPerlモジュールですので、ご希望通りに動作すると思われるのですが? 検索結果には検索キーで入力した文言にマッチするPDF文書の内容(の一部)が表示され、そのPDFへのハイパーリンクも自動的に付けられますので、ブラウザPDFをダウンロードor直接参照する事が出来ます。 namazuの実行イメージは下記URLです。参考にして下さい。

参考URL:
http://search.namazu.org/
myfrend
質問者

補足

PCFREAKさん、情報ありがとうございます。。 でも、windowsのインストールに失敗しています。 かかしもインストールする必要があるのでしょうか。。 インストールの順序は関係あるのでしょうか。

回答No.5

特定ドライブやフォルダ下のPDF文書の全文検索なら、 Adobe Reader 6.0以降でサポートされていますが? 表題の「PDFファイル」だけでなく、いろいろなファイル に対応したいのでしょうか? データベースと言っているのは、Excelレベルの話ですか? それとも、MySQLやPostgreSQL、あるいはOracle、SQL Serverなどの本物のデータベースのことですか?

myfrend
質問者

補足

質問の件について下記の通りです。 >いろいろなファイルに対応したいのでしょうか?  → PDFファイルのみです。 >データベースと言っているのは、Excelレベルの話ですか?  → 共有PCでxxxについて、yyyについてというのを掲載している    HP(htmlで記述してあって単に共有PCのPDFファイルをリンク(<a href="\....\xxx.pdf")    して他のPCから見れるようにしているだけです。やりたいことはその共有の    HP上(html記述)で入力した検索文字をキーとして検索するアプリケーション    を走らせたいのです。 MySQL、PostgreSQL、Oracle、SQL Server といった本格的なデータベース ではないです。 chukenkenkou さん、どうかアドバイスお願い致します。

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.4

最近は、namazuに加えて、 hyper estraier というシステムも人気があるようです。 xdoc2txtを使ってpdfを読みます。 http://hyperestraier.sourceforge.net/ http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

  • oyaoya65
  • ベストアンサー率48% (846/1728)
回答No.3

私はインストールして使ったことはありませんが「namazu(ママズ)」という全文検索エンジンを使えばできるかと思います。 PDFドキュメントの全文検索ができます。 フリーソフトです。 http://www.namazu.org/ http://www10.plala.or.jp/miyazawa/namazu/ http://homepage2.nifty.com/treknz/namazu.html 使ってみてください。

参考URL:
http://www.namazu.org/#download
  • kiriku
  • ベストアンサー率41% (195/468)
回答No.1

Windowsデスクトップ検索やGoogleデスクトップを使えば、PDFの全文検索ができます。

参考URL:
http://desktop.google.com/ja/filetypes.html

関連するQ&A

  • PDFの中の文字で検索

    PDFの中の文字で検索 パソコンの中にPDFで取り込んだ過去の種々の業者見積書のフォルダーがあります。その中からあるキーワードで検索してその見積書を抽出してその単価を知りたい(例えば「壁 クロス貼り 5m2 単価500円」 の場合はクロス貼りで検索したらその内訳書のPDF画面が見れる) それは可能なのでしょうか?

  • 「PDF」の検索

    googleとかで「PDF」を検索すると、ファイル形式がPDFのものまで膨大に検索されます。これを避けて、文章の中の「PDF」という言葉だけを検索する技を教えて下さい。

  • Namazu+xpdfでPDFファイルを検索した時の不具合

    Windows2000 ServerにNamazu+xpdfを入れて、 検索機能を実現しているのですが、 あるキーワードで検索したら、 キーワードが全く入っていないPDF文書が 出てきたりするのですが、 これを直す方法はどのようにすればよろしいでしょうか? 例えば、 Namazuで「更新状況」というキーワードで検索かけたとします。 そうすると、PDFファイルが1つ見つかったとします。 しかし、そのPDFファイルを開いて、Acrobatの機能で、さきほどのキーワード(更新状況)を 検索しても、「見つかりませんでした」と表示されてしまいます。 今度は、「更新」の部分を削って、「状況」だけをAcrobat上で検索すると、 その文字は見つかりました。 ということは、Namazu+xpdfでは、「更新状況」という文字を 「更」「新」「状」「況」という風に、 一文字ずつ区切って、検索しているのでしょうか? それはどこかの設定で変更することは可能なのでしょうか? 分かりにくい文章で申し訳ありませんが、 どなたか、ご教授ください。 おねがいします。

  • PDFファイルはインターネット上で検索にかかるか

    小さい会社のWEB担当をしています。 ある文章をWEBページに載せるようとしているのですが、印刷用として PDFファイルも載せる予定です。 そこで疑問に思ったのですが、PDFファイル内の文章は、Googleなどから検索対象になるのでしょうか? 普段検索しているとPDFファイルが引っかかってくることってありますよね。あれは何か特別な設定をしている(たとえばPDFファイルのタイトルや内容などを部分的に指定しているとか)ためにひっかかってくるのか、何の変哲もない普通のPDFファイルの内容が検索エンジンに引っかかってくるのかを知りたいのです。 詳しい方いらしたら、教えてください。WindowsマシンでIllustratorCS2を使っています。

  • PDFの本文を検索できるようにするには?

    本や新聞の切り抜きなどをスキャナで読み取ってグーグルデスクトップで本文中のキーワードを検索できるようにするにはどうしたらよいのでしょうか?PDF化したページが表示されればと思い、いきなりPDFスキャナ2 で新聞記事を透明テキスト付PDFにしてみましたが、本文中のキーワードで検索しても検索に引っかかりませんでした。ちなみにスキャナはブラザーA3カラー複合機ジャスティオMFC-6490CNです。

  • 検索可能にする方法

    検索可能なPDFにしてパソコン内のフォルダに保存し、その後保存したPDFをエバーノートやGoogle Chromeに添付して保存してみました。(ScanSnapから直でクラウドにやると検索可能なPDF500ページ制限があるので) そうしたら、パソコンのファイル内では本文中の検索もできたけれど、エバーノート、Google Chromeに添付したら検索できなくなりました(同じ単語を検索しましたが読み取れませんでした) 大量の書類を検索できる状態にしてクラウドに保存したいのですが、方法はありませんでしょうか? または、クラウドを使用せずにアンドロイドとパソコン間でデータ共有する方法はありませんでしょうか?(アンドロイドとパソコンが遠い距離でも共有できる方法) ScanSnapから離れた話にまでなってしまいましたが、アドバイスお願い致します。 ※OKWAVEより補足:「「ScanSnap/fiシリーズ/HHKB」商品について」についての質問です。

  • WORDやEXCEL,PDFファイル検索ソフト

    現在、蓄積された大量のWORDやEXCEL,PDFのファイルを サーバーに置いて知識データベースとしてブラウザから検索できる (ファイルの中身も検索できる)環境を構築しようと考えています。 利用者は30人ほどで検索頻度は少ない環境です。 ネット検索していてフリーのNAMAZUというソフトを見つけました。 その他、便利なソフトがあったら教えてください。 どうぞ宜しくお願い致します。

  • PDFファイルの全文検索

    ネット上での文書保管について検討しています。 ある企業の検索ソフトを確認して下記のことに気づきました。 ファイル検索について     ワード、エクセル、パワポ他、PDF化したファイルでも     全てのファイルをファイル名で検索でる。 全文検索     ワード、エクセル、パワポ他のファイルなら、文章の     中の何がしかのキーワードで検索できるが、PDF化した     ファイルでは全文検索はできない。 知っている人ならきっと常識なのでしょう。    「PDFファイルでは全文検索はできない」    「PDFファイルならファイル名でないと検索できない」 ということは、書類を電子保管する場合、検索機能が重要になる のですが、PDFで保管したファイルでは全文検索はできない、 ということになります。常にファイル名で検索するということに なります。 この認識は間違いないのでしょうか。 あるいは、何か違うソフトを使えばPDFファイルでも全文検索 ができるのでしょうか。 どなたかご教示いただければ幸甚です。

  • Windows7でのファイル検索

    仕事場のパソコンには、Windows9x時代から蓄積してきたたくさんのhtmlファイルがあります。 Windows9xの頃の検索ですから、ファイル名だけで検索できるように、ファイル名そのものをいろいろ工夫して、即座に目的のファイルにたどり着くことができる便利なデータベースとして使っていました。 ところがWindows7になってこの「即座に」という風には行かなくなってしまいました。 WindowsXPまではフォルダの右クリックメニューのなかに「検索」がありました。 それを選ぶとそのフォルダ(とさらに下層のフォルダ)を対象としたファイル名検索のウインドウがすぐに開きます(検索コンパニオンはオフにしてあります)。便利なことにこのとき検索キーワードを入力するボックスが既にアクティブになっていますので、すぐさまキーワードの入力作業に入れます。インクリメンタル検索などという機能はついていませんでしたが、検索キーワードさえ適切なら、ものの数秒で目的のファイルを見つけることができていました。 しかし、Windows7にはフォルダの右クリックメニューに検索がありません。一旦フォルダを開いてから右上の検索ボックスをわざわざアクティブにするかF3を押下しなくてはなりません。 さらに困ったことに、検索速度がとてつもなく遅いのです。Excelファイルしか存在しないフォルダなら遅さもたいして気になりませんが、Excel、テキスト、PDF、HTML等が下層に混在するフォルダを対象とした場合の遅さはかなりのストレスです。ヒットするファイル群はテキスト情報まで表示されていて一画面あたりのファイル数が少ないのも欠点ですし、なによりデフォルトの検索ではタグ情報まで検索するため、余計なファイルばかりがヒットしてなかなか目的のファイルにたどり着けません。ファイル名のみの検索のために、そのドライブ全体ののインデックス作成をオフにするのは、いざインデックス機能が必要になったときのデメリットが勝ります。 外部ツールを探してみると、 ・locate32 これはスピードは申し分ないのですが、リアルタイムで検索用データベースが更新されないため、私の使い方には向いていません。WindowsXPやWindowsVistaでは、フォルダを開いてからF3を押下すると、Locate32が起動してくれたのが、Windows7ではいつも最上位の「コンピュータ全体」からの検索になる点もいただけません。 ・FileSeeker3とEverythingの組み合わせは現在使っており、検索スピードとリアルタイムなところと検索するフォルダを複数選択できる点で満足はしていますが、毎日の初回の起動時のデータベース構築に時間がかかりすぎますし、起動のたびにUACが邪魔するのを避けるには、朝から晩まで起動しっぱなしでなければなりません。 そこで質問なのですが、 1.Windows7でフォルダの右クリックメニューにそのフォルダを検索対象としてlocate32などを起動させるための「検索」を装備させることは可能かどうか。可能ならどう設定するのか。Windows7標準のWindowsエクスプローラでの「検索」でも構いません。 2.右クリックメニューに追加できないなら、UACが邪魔をせず、ファイル名検索に特化した高速検索が可能で、ファイルやフォルダの移動にリアルタイムに反応してくれるようなツールがあるかどうか。 この際ファイル名以外の検索フィルタなどは不要ですし、インクリメンタルサーチも不要です。

  • Googleドライブのローカル検索ができない

    Google ドライブで共有しているローカルフォルダ内の検索ができません。 ローカルの場所は、C:\Users\(名前)\Google ドライブ\共有しているフォルダ です。 このフォルダを開き、右上の検索窓にキーワードを入力してもヒットしません。 Windows7です。 アップロードされているフォルダをブラウザでGoogle ドライブにアクセスして検索すれば、 こちらでは問題なくヒットします。 ローカル検索ができないと不便なのですが、仕様でしょうか。 解決方法をご存知の方、教えてください。