• ベストアンサー

イントラネットでファイル内キーワード検索

次のような命題が与えられています。 環境:企業内イントラネット エクセル、Power Point等のファイルがアップロードされている。 ★命題★ 「ABC012345」というキーワードがファイル内に含まれるファイルはコレとコレ・・のようにリストする。  膨大なファイル(のリンクがHTMLで書かれている) があるので、キーワードについて、どの文書に書かれているかを 検索したい。  ということなのです。  この命題を実現するには、どうしたらよいでしょうか。 よろしくお願い申し上げます。

質問者が選んだベストアンサー

  • ベストアンサー
  • techneco
  • ベストアンサー率35% (77/215)
回答No.3

有償のソフトウェアですが、 Accela BizSearchというのがあります。 テキストファイルやHTMLファイルだけでなく、文書ファイル(Word、一太郎、OASYS、PDF等)やRDB、グループウェア、CADファイル等に対応してます。 NAMAZUは辞書にない言葉は検索できませんが、 Accela BizSearch はNグラム方式で新しい言葉や社内用語にも対応できます。

参考URL:
http://www.accelatech.com/products/BS/system.html

その他の回答 (3)

  • TA-HT81S
  • ベストアンサー率39% (72/184)
回答No.4

1.です。 Namazuは全文検索のツールです。 夜間などにバッチで、対象となるファイルの中身を全て解析し、インデックスファイルを生成させます。(mknmz) インデックスの表示にはWeb画面が必要になりますので、Apacheなどを入れておきます。(namazu.cgi) 2回目以降のインデックスの生成は差分だけですので短時間で済みます。

回答No.2

> アップロードされている アップロードされていると言う事はサーバですね。 最近ではGoogleさんがかなり便利なので、自サイトであってもGoogle検索を使うなんて方法がありますが、閉じたサイトでは簡単ではないでしょうが、こんな商品も有るようです。 http://www.google.co.jp/enterprise/ 昔からよくやられている方法は、Namazuです(ナマズを飼う、というような言葉が有りますね)。 http://www.namazu.org/ Perl スクリプトなので、ほとんどの環境で動かす事が出来ると思います。サーバがお休みしているような時間帯(通常夜中)にインデックスを作成するので検索はかなり速いです。CGIとして動くので、WEBサーバから検索が出来て、更にダウンロード(共有)も出来ます。 参考まで。

  • TA-HT81S
  • ベストアンサー率39% (72/184)
回答No.1

全文検索ですね。 Namazuを使いましょう。 その際、xdoc2txtなどのNamazu用PowerPointフィルターも必要になります。 がんばってください。

moto039
質問者

補足

Namazuはファイル内全文検索ができるのでしょうか?

関連するQ&A

  • イントラネットで機能する検索エンジンを作りたい

    ASPを使ったプログラミングでイントラネットで機能する全文検索エンジンを作りたいと思っています。 検索エンジンの機能としては、イントラネット内にあるコンテンツ の表示は もちろんのこと、 Word,Excel,PDF等ファイル内の指定した文言が存在すると、 リストアップされ、リストアップされたタイトル部分をクリックすると該当文書をブラウザもしくはアプリケーションを起動して表示するといったものです。 良いプログラムソースを公開しているコンテンツがありましたら、教えていただきたいです。 どうぞよろしくお願いします。

  • InternetExplorerでショートカットファイル(lnk, maf)が開かない

    サーバにWebページを置き、イントラネットで共有しようとしています。 HTML文書に、ショートカットファイル(.lnk, .maf)をリンクさせ、元のファイルへアクセスしようとしています。 ローカル上では開くのですが、イントラ上ではショートカットファイルが開きません。 私の憶測ですが、ブラウザ(Internet Explorer)ではリンクできないのでしょうか? 原因がわかる方がいましたらどうかご教授願います。

  • 圧縮ファイルのままリンクを閲覧する方法

    一連の関連資料のまとめとして、リストのhtmファイルから、リンクで関連文書ファイル(Word、Excel等)で閲覧するように作成しています。リストと関連文書ファイルは同じフォルダに入れてあります。容量が膨大になるので、圧縮してzipファイルにしていますが、圧縮したまま閲覧しようとすると、リストのhtmファイルからリンクでWordファイルが開けません(勿論解凍すれば開けるようにはなっているのですが)。解凍しないで閲覧の状態からリンクが開くことができる、何かいい方法はありませんでしょうか? 方法があれば、教えてください。よろしくお願いします。

  • イントラネットで動作するCGIで出来たサイト内検索はありませんか?

    なんかタイトルが支離滅裂です・・・申し訳ない。 現在業務で必要な知識をまとめる作業をしておりまして、 その一環として、イントラネット内の自社サーバーでCGIを利用し、 既に製作済みの200ページ以上もあるHTMLから、 必要な情報を検索&表示できるようにしたいと考えております。 イメージ的にはサイト内検索のようなものです。 検索⇒検索キーワードに適合した既存のhtmlの一覧の表示⇒一覧から選択したHTMLを表示・・・というイメージです。 そのような機能を持つCGIをご存知でしたら、 フリーとシェアでオススメを教えていただけないでしょうか? 機能の具体的な説明としては、 (1)検索フォームがある。 (2)ドロップアンドリストでジャンル検索できる機能があれば良いが、無くても良い。 (3)検索機能の幅は、『HTMLのtitleタグ内』『bodyタグ内』を同時に検索してくれるタイプが好ましいと考えております。 (4)PHPだろうがなんだろうが、CGIではなくても動作するのなら言語は問いません。 HTMLなら多少わかるのですが、CGIはさっぱりで・・・ どなたがご助力お願いいたします。申し訳ありません。 お返事お待ちしております。

    • ベストアンサー
    • CGI
  • 設定したキーワードを含むリスト表示について

    初めて質問させて頂きます。 現在仕事で、特定ユーザーにのみ公開しているホームページの メンテナンスを担当しており、今度リニューアルすることになりました。 ただ、やりたいことは頭で決まっているのに実現方法の検討もつかず、 ネット検索でも限界を感じています。 以下にやりたいことを簡単な例に置き換えて記載しましたので、 実現方法についてアドバイス頂けたらと思い投稿しました。 どなたかご親切な方、宜しくお願い致します。 ■用意するHTMLファイル 【果物のHTMLファイル】    いちご.html : 500円 赤 スーパー    バナナ.html : 300円 黄色 コンビニ    みかん.html : 300円 オレンジ スーパー/コンビニ    リンゴ.html : 300円 赤 コンビニ 【値段検索ページ】 【色検索ページ】 【販売店舗検索ページ】 ■やりたいこと 上記「各果物のHTMLファイル」に、値段、色、販売店舗に関する キーワードを設定しておきます。 各検索ページを開いた時の表示状態は、以下の通り キーワード毎に自動的にリスト表示されるようにしたいです。 ■各検索ページを開いた時の表示状態 【値段検索ページ】    500円     - いちご.html    300円     - バナナ.html     - みかん.html     - リンゴ.html 【色検索ページ】    赤     - いちご.html     - リンゴ.html    黄色     - バナナ.html    オレンジ     - みかん.html 【販売店舗検索ページ】    スーパー     - いちご.html     - みかん.html    コンビニ     - バナナ.html     - みかん.html     - リンゴ.html 「果物のHTMLファイル」にはどのようにキーワードを設定すればよいでしょうか? また、各「検索ページ」にはどのような記述を行えば「果物のHTMLファイル」に 設定したキーワードを自動抽出→リスト表示できるのでしょうか? HTML 初心者なので、難しいことは残念ながらできません。 もし、"この書籍に付属の DVD にやりたいことが実現できるコードが含まれているよ" など、ご存じのことがあれば是非教えてもらえないでしょうか。 宜しくお願い致します。

  • こんなことが実現可能か

    私はXMLについてはほとんど無知なんですが、 以下のことが実現可能なんでしょうか? XMLには商品の名前とその商品のキーワードの要素が書かれいています。 それをXSLを使って、商品のリンク(amazonなどの外部のページ) とキーワードより求めた類似商品のリスト表示ようのリンク を備えたHTMLを生成したいと思っています。 C言語とHTMLしかしたことがなく、 XMLはその二つを兼ね備えたものだと 誤認しているかもしれません。 どうやったら上記のことを実現できるか 助言してください。 もし、かなり困難なことであれば それも書いてください。

    • 締切済み
    • XML
  • Power Point(パワーポイント)のファイルが開けなくなってしまいました。

    Power Point(パワーポイント)のファイルが急に開けなくなってしまいました。 今までは普通に開くことができたのですが、Power Pointのファイル名を変更したら、開かなくなってしまいました。 ファイル名を元に戻しても開きません。 環境、症状は下記のとおりです。 WinXP、Power Point2000 プレゼン資料を今朝作成して、それをアップロードするために日本語ファイル名から、英語のファイル名に変更。そしたら開かなくなりました。 どのようにしたらファイルが開けるようになるのでしょうか? もしご存じの方いましたら教えてください。

  • エクセル表の中にリンクが貼られているwordファイルの中身をキーワード

    エクセル表の中にリンクが貼られているwordファイルの中身をキーワード検索して、検索結果を表示したいのです。 ※マクロ超初心者です。 次のような10,000行データがあるエクセル表があります。    A(野菜) B(果物) C(色) D(word文書にリンク) 1  きゅうり  りんご   赤    ファイル1.doc 2  トマト   バナナ   黄    ファイル2.doc 3  レタス   ぶとう   紫    ファイル3.doc 4  キャベツ  梨     オレンジ ファイル4.doc ・ ・ ・ このエクセル表からリンクが貼られた(D列)すべてのword文書全文の中から、キーワード検索して 検索した結果該当するword文書にリンクを貼っているエクセル表のデータを抜き出して、 一覧表にすることはできますか? 例えば、キーワード検索した結果、ファイル1.docとファイル4.docにそのキーワードが含まれていた場合、 1  きゅうり  りんご   赤    ファイル1.doc 4  キャベツ  梨     オレンジ ファイル4.doc という、表示結果になってほしいのです。 一発で結果表示できなくても、2段階実行とかでも構いません。 どうでしょうか? 至急、教えて下さい!お願いします!!

  • フォルダ内ファイルの参照とリスト作成

    以下のことをやりたいのですが、 教えてください。 在るフォルダ(例えば;abc)にファイルをアップロードします。 そのファイルをユーザーにダウンロードさせるのですが、 条件として、当該ファイルの名称を変更できません。 ファイル名を固定(アップロード時に変更)できれば、 どうにでもなりますが、それが出来ないために、 アップロードされたファイルを見に行って名称を把握、リストする、 ということがやりたいのです。 一言でいうと、 フォルダにあるファイルをリストする方法が知りたいのです。 ユーザーに提供するのは、「ダウンロード.html」という格好を考えています。 このhtmlを作るcgiを考えたいのです。 宜しくお願いします。

    • ベストアンサー
    • Perl
  • 画像アップロードの際のHTMLファイルとの関係教えてください!

    ホームページ上に画像を配置する際、FTPなどでアップロードし<img=src"画像名">で表示させると思うのですが、アップロードの際、画像とHTMLファイルを同じ場所に置くというのがいまいち解りません。 HTML文書をワードやメモで保存し同じpublic_htmlのファイルの下に置けばよいのでしょうか? HTMLファイルというのはどの形式?で作るものなのかわかりません、どなたか教えてください、よろしく御願いします。

専門家に質問してみよう