• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:WWWの中を検索して、前後の情報と URL をリストアップしてくれるソフトはありますか?)

WWWの中を検索して、前後の情報とURLをリストアップするソフトはありますか?

このQ&Aのポイント
  • WWWの検索には検索エンジンを利用することが一般的ですが、特定の条件に合致する情報を探すためには自力で検索を行うソフトが必要です。
  • もっとも低機能な場合は、指定した文字列を含む前後100文字程度を抽出し、それに対応するURLをリストアップします。
  • より高機能なものとしては、正規表現を使用して特定のパターンにマッチする情報を検索することができます。見つかった情報はURLとともに出力されます。

質問者が選んだベストアンサー

  • ベストアンサー
  • ShaneOMac
  • ベストアンサー率39% (356/898)
回答No.2

>カタカナ語(の例)をたくさん探してくるとかいった使い方 日本語で書かれたHTMLのほとんどにカタカナ語が含まれていると思いますが。 検索というものは膨大なデータの中から目的に合うデータを抽出し人間が扱える程度のデータ量にまとめるという機能です。漠然とした条件しか与えないと返ってくるデータ量が大きくなり扱うことが困難になります。コンピュータにコマンドを出すときはいかに自分の目的を正確に伝えるかがポイントになるでしょう。 日本語のwebサイトがもつHTMLファイルのストレージスペースがどれほどのものか分かりませんが、巨大なものだということは察しが付きます。そういった漠然としたデータを要求して返されるデータを考えると、とてもじゃないですが個人のパソコンに収まる量じゃありません。 せめて検索範囲を絞って処理量を限定するとか、処理内容をもう少し具体的にしてやらないと、データとして返ってきても使いようがないと思います。 例えば ・Yahooディレクトリ内の特定カテゴリ以下のリンクを検索する ・カタカナ語を見つけるとそれを抽出しデータベースに書き出す ・「語/カウント」形式のデータベースとする あるいは ・カタカナ語だけ色つき表示するブラウザ といったものなら現実的ですし、それほど難しくなく書けるプログラムです。しかしそこに検索アルゴリズムやデータ処理の技術を付加したものとなると個人でまかなえるプロジェクトの範囲を出てしまうような気がします。

ogx
質問者

お礼

 再度のご回答、ありがとうございます。  「カタカナ語」の例は、あまりよくなかったかもしれません。検索結果が個人のパソコンに収まる量ではないというのはわかりますが、それは、たとえば、何例見つけたらやめるとか、何GB書き出したら終わりにするとかいうことで何とかなると思います。検索対象の前後の文脈だけを100文字程度つなげるとすれば、そんなに(扱えないほど)複雑ではないと思います。そういうのがパソコンの中のどこかのファイルに入っているならば、それを自作プログラムなり適当なコマンドやマクロなりで処理加工することは、まあ、できると思いますが、その基礎となるWWWからの用例集作りの部分が困難なように思っています。  ロボット型の検索エンジンでは、毎日、あちこちのサイトを見に行って、キーワードを抽出して蓄積しているわけですよね。それと同様のことをして、キーワードでなくて、利用者の指定したものを探し、文脈付きで書き出すという程度のもので十分実用的になると思うのですが。  

ogx
質問者

補足

 最近、求めていたソフトに出会いました。  WWW retriever といいます。  http://www3.to/taru にあります。  というわけで、当面は、この問題は解決しました。 2003.12.13

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • ShaneOMac
  • ベストアンサー率39% (356/898)
回答No.1

Justの「インターネットブーメラン」が近いかと思います。単売もしていますしオフィスに付いてきたりもするソフトです。 http://www.justsystem.co.jp/software/dt/ib/index.html 業務用ナレッジマネージメント技術としてJustが持っているConceptBaseテクノロジーをもとに一般向けに出したソフトです。 http://www.justsystem.co.jp/km/ 目的に合うものかは分かりませんが。

ogx
質問者

お礼

 早速のご回答、ありがとうございます。  インターネットブーメランは、「こんな概念に近いものを探す」というようなソフトだと思いますが、私がほしいと思っているのは、もっと表面的な言語表現主体のものです。WWW の中を自力で探し回って、カタカナ語(の例)をたくさん探してくるとかいった使い方を考えています。検索のスピードはまったく気にしていません。  というわけで、インターネットブーメランは私の目的にはあわないようです。  需要が少ないということで存在しないのなら、オリジナルソフトを作る必要がありますが、私の技術ではとても無理です。  どこかのソフト会社に作ってもらうとか、(いくらくらいかかるんでしょうか)理工系の大学の学生に頼んで、アルバイトとしてやってもらうとかになるのでしょうか。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 指定した文字列を含むURLを検索・リスト表示できるソフトを探しています

    指定した文字列(例えば、http://○○○.jp/など)を含むURLを 全て検索し、リスト表示できるフリーソフトを探しています。 知っている方がいましたら、教えて下さい。

  • フォルダーの中にあるファイルのバイナリデーターの検索を行えるソフトを探

    フォルダーの中にあるファイルのバイナリデーターの検索を行えるソフトを探しています。 環境はwindowsXPです。 フォルダーの中にあるファイルに含まれる特定のバイナリデーターを検索するソフトウェアを探しています。 ファイルを特定のバイナリエディターで開けば検索機能を使って検索できますが、ファイル数が多い場合すべて検索するのは大変です。一度に検索できるソフトはないでしょうか? 文章に含まれる文字列を探すのではなく、例えばexeファイルの中にある文字列を検索する場合バイナリデーターとして検索したいということです。できれば、アスキーかユニコードか指定できるとうれしいです。 文字検索ではなく16進数などで指定して検索でもかまいませんので知っている方は回答よろしくお願いします。

  • Perl で Excelファイルからデータを検索、エラー表示

    あるExcelファイルを利用してターミナル上で情報を出力出来るようにしたい。<<< ここまでは出来ていますが、 あとはいくつかの機能を付けたいのです。 下記の機能を追加したい: 1.検索文字列指定 -指定ありの場合、その文字列を検索対象とする 例えば:sun を検索対象文字列にする $./perl sun -指定なしの場合、文字列の入力を促す。 例えば:検索文字列? > (検索したい文字列を入力)  $./perl 検索文字列? > 入力がなくリターンのみで実行された場合にはコマンドを終了する。 2.エラー出力 -検索文字列が見つからないか、 入力ミスによるエラーを表示

  • C#でのファイルの中にあるURLの読み取り

    現在私はC#で、プログラムを作成しているのですが、その中で少しわからないことがあります。 作成しているプログラムの中に、ファイルの中に書かれているURLを取り出す、という機能を付けたいのですが、ファイルを読み込んだ時に、その中にあるURLをどうやって取得していいのか分からないのです。 いろいろ検索してみた結果、Indexofメソッドを使用したときに、特定の文字列が含まれているかどうか検索することができるらしいのですが、それを使用して、どのような長さをしているかもわからないファイル中にあるURLを、どのように取得していいのか想像もできません。 質問が稚拙で、しかも言いたいことが分かりにくいかもしれませんが、どなたか回答、または詳しくそのやり方が載っているサイトの紹介をよろしくお願いします。

  • HPのURLにwwwをつけた方がよいのか?

    質問させていただきます。 当方HPをつくっているのですが、URLにwwwをつけた形でSEOを進めていくか、抜きでSEOを進めていくか迷っております。 当方のHPはYahooに登録されているのですが、 Yahooにはwwwがついた形で登録されています。 一度yahooの方にwwwを抜いてくださいと問い合わせたところ、 これからはwwwをつけた形で登録していくとの事で受け付けてもらえませんでした。 そこで疑問なのですが、yahooがwwwをつけた形にしていくということは やはり他の検索エンジンなどでもwwwを付加した形に変わっていくのでしょうか? またこれからのURLはwwwをつけた形でつくっていったほうがよいのかどちらでしょうか? なにぶんこういう難しい質問はなかなかお答えづらいかとは思いますが、 よろしくお願い致します。

  • Mac検索・置換ソフトを紹介してください

    複数のファイルの文字列を、検索・置換できるMacソフトを紹介してください。 複数あるHTMLファイルの特定の文字列を一括置換したいです。 検索エンジンで検索をしてみたのですが、ソフトが古かったりして上手く見つけることができませんでした。 有料・無料は問いませんので、検索・置換ソフトを教えていただきたいです。 ターミナル操作での、検索・置換は、コマンドを知らないのでできません。 私の環境は以下のとおりです。 OS:OS X 10.9 Marvelous 大変申し訳ございません。 ご教示よろしくお願いいたします。

  • 重複したファイルを検索、削除できるソフトについて

    重複したファイルを検索、削除できるソフトでお勧めありますでしょうか。 以下の機能があるソフトがいいです。  ・サイズが同じファイルを検索する。  ・名称などが違っていてもファイルの内容で重複ファイルを検索する。  ・サイズは違うが名称が同じファイル名のファイルを検索する。  ・サイズは違うが名称が近いファイルを検索する。    指定文字を抜かしてファイル名が指定文字数以上同じかを判別できる。 説明がわかりにくいかもしれませんが、よろしくお願いします。

  • 複数Powerpointファイルの横断検索ソフト

    フリーウェアか、格安シェアウェアで、複数のPowerpointファイル中のチャートに書かれている文字列を検索できるソフトを探しています。 検索するフォルダーと文字列を指定すると、そのサブフォルダーまですべてのPowerpointのファイルを(いちいち開けてCtrl + F キーでファイル単位の検索を繰り返さなくても) 検索対象にしてくれて、結果としてその文字列の入ったファイル名とそのパス位がわかれば十分です。 普通にググれば見つかるものだと思っていましたが、意外とみつからず、困っています。

  • ファイル検索ソフトを教えてください

    PC中のあちこちに散らばったファイルを検索するソフトを探しています。 その際、ファイル名だけでなく、 そのファイルの文書中の文字列も検索対象にしてくれるようなソフトがありましたら、教えてください。

  • URLの中に含まれる文字列を検索

    タイトルのとおりURLの中に含まれる文字列を検索するにはどのようにすればいいのでしょうか。 例えば、"conference"が含まれているURLを検索した結果、 http://gogoiti.co.jp/conference/other/ http://openelectronic.co.jp/conference/pagepage/ ・ ・ ・ といった風にconferenceが使われているサイト数を知りたいのです。 googleの詳しい検索方法を使えばできるのかと思ったのですが、調べてみたもののたどり着けませんでした。 どなたかご存知の方よろしくお願いします。

このQ&Aのポイント
  • Wi-Fi接続が突然できなくなり、再設定してもプリントができないというトラブルです。
  • お使いの環境はスマホ(iOS 13.7)とパソコン(Windows10)で、無線LANで接続しています。
  • 電話回線の種類はひかりです。
回答を見る

専門家に質問してみよう