• 締切済み

テキストを部分ごとに抽出できるソフト

あるキーワードから次のキーワードまでを文章を抜き出し、ファイルへ書き込みたいのですが、 どのようにすればいいのか分りません。 例 --------- キーワード1 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ --------- キーワード2 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ --------- キーワード3 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ からキーワード1とキーワード3を抽出したい場合 --------- キーワード1 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ --------- キーワード3 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ などと抜き出されるようにしたい。 このようなことができるフリーソフトご存じないでしょうか?

  • devid
  • お礼率34% (166/478)

みんなの回答

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.1

 最も早いのはSED( http://ja.wikipedia.org/wiki/Sed_%28%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%29 )です。数千行あっても一瞬で終わる。  また、フィルタ( http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A3%E3%83%AB%E3%82%BF_(%E3%82%BD%E3%83%95%E3%83%88%E3%82%A6%E3%82%A7%E3%82%A2) )を使う方法が一般的でしょう。UNIX用のフィルターにはWindowsに移植されたものが沢山あります。( http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A3%E3%83%AB%E3%82%BF_%28%E3%82%BD%E3%83%95%E3%83%88%E3%82%A6%E3%82%A7%E3%82%A2%29#UNIX.E3.81.AE.E4.B8.BB.E3.81.AA.E3.83.95.E3.82.A3.E3.83.AB.E3.82.BF.E3.83.97.E3.83.AD.E3.82.B0.E3.83.A9.E3.83.A0 )  UNIXの世界では、優れたプログラムを作ると基本的に自由に利用できますから、わざさわざフリーと断らなくても・・  これらは敷居が高ければ、AWK,Perl,Rubyなどを使うと楽でしょう。  

devid
質問者

お礼

フリーソフトの名前や具体的な方法を知りたかったのですが、 ジャンルを変えて質問してみます。

関連するQ&A

  • キーワードパターンの抽出

    あるキーワードから次のキーワードまでを文章を抜き出し、ファイルへ書き込みたいのですが、 linuxのコマンドでできますでしょうか? 例 --------- キーワード1 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ --------- キーワード2 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ --------- キーワード3 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ からキーワード1とキーワード3を抽出したい場合 --------- キーワード1 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ --------- キーワード3 --------- 文字や数字・・・・・・・・ ・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・ などと抜き出されるようにしたい。

  • テキストファイルからの時間の抽出について

    初めて書き込みします。今会社でテキストファイルに書かれた文章から時間を抽出する課題を渡され八方塞がりで困っています。どなたかいい方法をご存知でしたら教えていただけないしょうか? (例)100mのクロールのタイム時間 A君  90秒 B君  95秒 C君  85秒 ・ ・ ・ G君  89秒 このようなテキストファイルの作りで 90秒 95秒 85秒 ・ ・ ・ 89秒 のように数字だけを抽出したいです。よろしくお願いします。

  • テキストの一部分だけを変えたものを出力できるソフトはありますか?

    これは●番目です。 そして次は■番目です。  というようなテキストの、●■の数字部分が、以下のように、数字が一つずつ上がっていくように量産してくれるソフトを探しています。 これは1番目です。 そして次は2番目です。 これは2番目です。 そして次は3番目です。 これは3番目です。 そして次は4番目です。  このような処理をしてくれるフリーソフト、または、エクセルなどのテクニックはありますでしょうか?どうかよろしくお願いします。

  • このようなテキストの抽出は・・・。

    次のようなテキストを抽出するにばどうすればいいのでしょうか。 次の条件の文字列変数theVarにおいて、*の部分を抽出したいです。 <i>*</i> <i>と</i>はないかもしれません。 「*」はワイルドカート、「<」と「>」はメタキャラではなくただの文字。 よろしくお願いします。

  • テキストファイルをエクセルに取り込みたい

    大量のテキストファイルから必要なデータを抽出し、エクセルに貼り付けたいのですが、何か良いフリーソフトを御存知でしたら紹介して下さい。 ○テキストからデータを抽出(抽出キーワード30個程度) ○抽出したデータをcsvに適したように自由にカンマで区切る ○抽出されたデータをcsvまたはxls方式で書き出し 以上の機能がほしいのです。 よろしくお願いします。

  • ファイル名からファイルを抽出できるフリーソフト

    ファイル名からファイルを抽出できるフリーソフトをご存じないでしょうか。 ここに2000件のtsvファイルがあります。そこから1500件を抽出したいのです。 それぞれのファイルには番号がついていて(「file15_0143.tsv」「file300_3425.tsv」など)、抽出したい番号の一覧が別にあります(list.dat)。一覧には「10,101,203・・・」など抽出したいファイルの番号だけ(1500件ぶん)が記述されています。 ちなみに、ファイル名の後半部分_0143、_3425は乱数なので、抽出したい番号はfileのすぐあとの数字です。しかも、乱数が違う同じ番号のfileは複数あったりするのですが、番号が同じならすべて抽出して構いません。 やはり複雑で難しいでしょうか。 どなたかお教えいただけますと幸いです。

  • テキストを抽出したい

    次の ?(半角1文字)の部分を抽出したいのですが。 "* (?:)" アスタリスクにはどんなテキストが入るか分かりません。 このテキストの抽出の仕方を教えて下さい。 よろしくお願いします。

  • 画像から文字を抽出するソフト

    画像から文字を抽出するソフトを探しています。 できればフリーでお願いします。 ひとつお聞きしたいのですが、ソースネクストの『いきなりPDF』はスキャナで取り込んだ画像から文字を抽出するみたいですが、元々あるJPEGなどから文字を抽出することは可能なのでしょうか? 回答お願いします。

  • ファイル名の一部分の文字列をテキスト化するフリーソフトを探しています。

    ファイル名の一部分の文字列をテキスト化するフリーソフトを探しています。 例えば、 2009_44_0145_a_a_01.jpg のようなファイル名があったとし、このファイル名の「0145」という文字列を テキスト化や抽出やテキストエディタに書き出したりしてくれるような フリーソフトはありませんでしょうか? 2009_44_0145_a_a_01.jpg 2009_44_0145_a_a_02.jpg 2009_44_0145_a_a_03.jpg などのファイル名がありこれに通し番号をつけエクセルで表にしたいのです、例えば A | B | C 0145 | 2009_44_0145_a_a_01.jpg | 風景1 0145 | 2009_44_0145_a_a_02.jpg | 風景2 0145 | 2009_44_0145_a_a_03.jpg | 風景3 のようにしたいのです。大量のファイル名をテキスト化するフリーソフトは見つけ Bの部分はできましたがAのぶぶができません。。。 ファイル数が2000個ほどあるので結構大変です。 PCOSはXPです。 良いフリーソフトをご存知の方情報提供お願いします。

  • 欲しい部分だけを切り取るソフトは?

    画像ファイルで、余計な背景や人物等をカットして、欲しい部分だけを抽出 出来る、操作が簡単なソフトを教えて下さい。 出来ればフリーソフトや、通常のメーカーパソコンに入っているソフトだと嬉しいです。

専門家に質問してみよう