• 締切済み

日本語と英語で書かれているテキストから英文だけを抽出したい

英文ファイルの中に日本語の説明が入っていますが、英文だけを抽出したい場合、どうすればいいですか。Perの正規表現で英文抽出作業をしたいですが、ヒントが出て来ません、教えていただけますか。

みんなの回答

  • 2007Taro
  • ベストアンサー率47% (24/51)
回答No.1

 以下のところが参考になるかもしれません。 http://oshiete1.goo.ne.jp/qa2178460.html?ans_count_asc=1

wu2long
質問者

お礼

コメントありがとうございました。 おかけ様で問題が解決できました。

関連するQ&A

  • 日本語だけを抽出したい

    SJIS、EUC、UTF8、のどれがくるかわかりませんが、 かつ、その中で、どの言語がくるかわかりませんが、 その中で、日本語だけを、可能な限り容易に判別する方法は ありますでしょうか? また、既存のモジュールを可能な限り使用しない方法でもあります。 #pureperlで書かれていれば、移植はできますが ひらがな、カタカナを抽出すればいいのもありますが、 仮対処にしかならず、漢字だけの場合の抽出が できなくなってしまいます。 以下、参考までに・・ 内部コードがSJIS? #内部コードも、SJIS、EUC、UTF8のどれになるかわかりません。 UTF8の日本語がきたら、SJISになる UTF8の中国語がきたら、化ける(捨てる対象 EUCの日本語が来たら、SJISになる EUCの韓国語がきたら、化ける(捨てる対象) SJISの日本語が来たら、そのまま ・・のような感じになってしまいますので。。 よろしくお願いします。

    • ベストアンサー
    • Perl
  • 日本語を英文にしてください

    すいませんが下記の文を英文にしてほしいです。 「私の気持ちを英語で説明できないので日本語でメールします」 という文を英文にしてほしいです。 よろしくお願いします。

  • 日本語(コメントを除く)を抽出してEXCELファイルに羅列させる。

    VBの質問です。 標準EXEの中にあるフォームと標準モジュールの中の コードから日本語を(コメントを除く)抽出してEXCELファイルに 羅列させていくんですけど...。その場合 標準モジュールフォルダの中に任意で一つSampleモジュールなりなんなりをつくりコーディングしていくんでしょうか??それとコードから抽出した日本語をExcelファイルに羅列させていく場合どんな感じにすればいいでしょうか??VBは組んだことがなくて.... どなたかアドバイスよろしくお願いします。

  • 英文を日本語に訳してください。

    英文を日本語に訳してください。 よろしくお願いします。 Thank you so much! I took it down because I didn't want it to leak out per se'. LOL! Just wanted you to hear it.

  • テキストファイルから日本語部分を抽出

    英語と日本語が交ざっているテキストから日本語部分を抽出するプログラムをPerlで書きたいと思って以下のようなプログラムを組みました。 --- #!/usr/bin/perl print "Input file name: "; $ifname = <STDIN>; #print "Output file name: "; #$ofname = <STDIN>; $ofname = ">> tmp.txt"; open(INPUTFILE, $ifname); open(OUTPUTFILE, $ofname); while($c = getc(INPUTFILE)){ if('a'<= $c && $c <= 'z' || 'A'<= $c && $c <= 'Z'){ }else{ print OUTPUTFILE $c; } } close(INPUTFILE); close(OUTPUTFILE); --- これを実行したところ、日本語も英語も書き出されず、数字だけ書き出されてしまいました。 日本語部分だけを抽出するようにするにはどのようにすれば良いでしょうか。 ご教示願います。

    • ベストアンサー
    • Perl
  • 英語サイトの日本語化について

    仕事で英語サイトを日本語化(翻訳)しなければいけませんが、Dreamweaverで英文テキストの翻訳を直接タイプすると、文字化けしてしてしまいます。メタタグの部分、charset=iso-8859-1をcharset=shift_jisに変えたりしたのですが、文字化けが直りません。どなたか、Dreamweaverでどうすれば英文サイトファイルを日本語化出来るのか教えていただけますでしょうか。又、今後作業を続けていくにあたり、気をつけたほうがいいポイント等、アドバイスいただければ幸いです。どうぞよろしくお願いいたします。

  • 日本語と英文の併記にする方法

    ワードで日本語と英文のファイルが2つあります。 それらを改行ごとに日本語と英文の併記にするにはどうするのですか windowsxp office2000 使用

  • 「日本語を含む」はどう表現したら…

    英文で書かれたドキュメントがあって、その中に一部分だけ日本語の箇所があります。 このことを注意書きで添えたいのですが、どのように表現したらよいでしょうか?

  • 英文の中にある日本語の発音

    初歩的な質問ですが、ご回答よろしくお願い致します。 ネイティブが英文の中にある日本語を読むと、発音が当然ですが違います。 では日本人の私達が英文の中の日本語を読むとき、日本語とは思わずに読むのでしょうか、あるいは正しい日本語の発音で読んでもいいのでしょうか? 前者ですとなんだかくすぐったい感じがして、後者では流れが切れてしまっておかしな感じです。

  • サーバーのログデータを抽出

    redhat8.0のサーバー上にあるログデータをホームディレクトリにコピーし、コピーされたファイルの中のログデータをperlの正規表現を使って抽出し、抽出されたデータを別ファイルに書き出したいのです。 初心者なのでわかりやすく回答していただけると助かります。

    • ベストアンサー
    • Perl