締切済み

正規表現についての質問です。

2009/09/29 15:25

正規表現につての質問です。今テキストファイルに下記のような漢字と数字が並んでいます。そこから、漢字一文字だけの行を抜き出してきたいのですが、うまくいきません。PerlとCygwinを使用しています。よろしくお願いします。人584504122 情報542701982 商品510342870 日414551872 方347990908 者347069359 中339925319 表示330177395 的324961911 私323727263 検索291502623 見ル285226619 場合275698771 一256241900 利用253752129 年240881734 時239273060 前228762989 店225241510 登録224560617 　　・　　・　　　・プログラム中身 #! /usr/bin/perl -w #テキストから指定した単語などとマッチすると、 #その単語を含んだ文を抜き出してくる。 while(<>){ s/　+//g; s/\s+//g; if(/^([亜-煕]|[一-龠]){1}[0-9]*/){ print; print "\n"; } }

welcomeyit
お礼率0% (0/3)

その他（学問・教育）
回答数3
ありがとう数2

みんなの回答 （3）
専門家の回答

みんなの回答

A88No8
ベストアンサー率52% (834/1602)

2009/09/29 16:22 回答No.3

こんにちは＃２の補足です。　grepやsedで先頭が漢字１文字でその後にANK数字が続くパターンなら下記のようにします。 ^[亜-煕一-龠][0-9][0-9]* 　正規表現に関してはそれほど違いはないのではと思って投稿しています。外していたらごめんなさい。

A88No8
ベストアンサー率52% (834/1602)

2009/09/29 16:13 回答No.2

こんにちは　ＰＨＰについては門外漢なのですが、grepやsedの正規表現の場合に先頭の１文字目を漢字とするなら以下のようにします。 ^[亜-煕一-龠] 　外していたらごめんなさい。

takapiii
ベストアンサー率55% (944/1707)

2009/09/29 16:12 回答No.1

文字コードはなんでしょうかね…。後、perlのバージョンが不明ですが、頭が漢字一文字で、その後ろに数字のみが繋がっている場合のみ抜き出すなら、質問者のソースをちょっと改造すると以下の感じです。漢字の後に数字以外のものが入れば抜き出せません。文字コードはeuc-jpを想定します。 use encoding "euc-jp"; while(<>){ s/　+//g; s/\s+//g; if(/^\p{Han}{1}\d*$/){ print; print "\n"; } }

関連するQ&A

正規表現について
正規表現につての質問です。今テキストファイルに下記のような漢字と数字が並んでいます。そこから、漢字一文字だけの行を抜き出してきたいのですが、うまくいきません。PerlとCygwinを使用しています。よろしくお願いします。人584504122 情報542701982 商品510342870 日414551872 方347990908 者347069359 中339925319 表示330177395 的324961911 私323727263 検索291502623 見ル285226619 場合275698771 一256241900 利用253752129 年240881734 時239273060 前228762989 店225241510 登録224560617 　　・　　・　　　・プログラム中身 #! /usr/bin/perl -w #テキストから指定した単語などとマッチすると、 #その単語を含んだ文を抜き出してくる。 while(<>){ s/　+//g; s/\s+//g; if(/^([亜-煕]|[一-龠]){1}[0-9]*/){ print; print "\n"; } }
- 締切済み
- その他（学問・教育）
正規表現で
正規表現で $ruby = "昨日の天気（てんき）は雨だったが、今日は快晴（かいせい）だ。明日の天気は曇りの可能\性（かのうせい）が高い"; $ruby =~ s/([亜-煕]|[一-龠])（([^）]*)）/<ruby><rb>$1<\/rb><rp>（<\/rp><rt>$2<\/rt><rp>）<\/rp><\/ruby>/g; としたら実行結果がこうなりました。昨日の天気（てんき）は雨だったが、今日は快・ruby>ー（かいせい）だ。明日の天気は曇りの可能・ruby>ォ（かのうせい）が高いどうすればよろしいですか？
- ベストアンサー
- Perl
正規表現について
いつもお世話になっております。 perlの正規表現で分からない事があります。ご存知の方がいらっしゃれば、アドバイスを頂けますようよろしくお願い致します。 (質問内容) 以下のようなプログラムを実行した場合、matchが出力されてしまいます。 $aには、「、IS」を設定しているので、「真」と扱われないと思うのですが、何故、matchが出力されるのでしょうか？また、「偽」として処理をいしたい場合、どのようにすればよろしいのでしょうか？ #!/usr/bin/perl $a = "、IS"; $b = "AIS"; if ($a =~ $b){ print "match\n"; } else{ print "not match\n"; }
- 締切済み
- Perl
正規表現の書き方に困っております。
あるSQLのダンプを変換するプログラムをPerlで書いているのですが、うまく正規表現が書けなくて困っております。データの途中に,が有ると、うまくいきません。 ''の中に囲まれた,は無視するという正規表現を書きたいのです。また、'''B'も正しく処理できれば、完璧です。 #!/usr/bin/perl use strict; use warnings; #my $a = qq{'A','B',1}; --> うまくいく　 ['A']['B'][1] #my $a = qq{'A,','B',1}; --> うまくいかない ['A] ['] ['] my $a = qq{',','''B',1}; --> もっとうまくいかない ['][']['] if($a =~ /(.+?),(.+?),(.+?)/){ print "[$1]\n"; print "[$2]\n"; print "[$3]\n"; }else{ print "ERR!\n"; } exit; __END__
- ベストアンサー
- Perl
正規表現での$1や$2の使用方法
正規表現の置き換え文字列部分で使用できる$1や$2の使用方法を教えてください！以下のソース１のようにs///gの置き換え文字列部分に$1や$2を直接記述すれば、１つ目と２つ目のマッチ部分で置換が行われるのは確認しました。しかし、ソース２のように置き換え文字列部分を変数に代入したのち、使用すると、正しく置換が行われません。 $1や$2を含んだ置き換え文字列を変数に持っている状態で、ソース１と同じ結果を得るにはどうしたらよいか、ご存知でしたら教えて下さい。 ############################## # ソース１ ############################## #!/usr/bin/perl $data = '1234567'; $ptn = '(\d{3})(\d{4})'; $data =~ s/$ptn/$1-$2/g; ############################## ↓ $dataは123-4567となる。 ############################## # ソース２ ############################## #!/usr/bin/perl $data = '1234567'; $ptn = '(\d{3})(\d{4})'; $str = "$1-$2"; $data =~ s/$ptn/$str/g; ############################## ↓ $dataは-となる。
- ベストアンサー
- Perl
正規表現が読めない
諸般の事情でperlスクリプトに手を入れることになりました。 perlについてはまったくの素人であることに加えて、正規表現が読めません。お恥ずかしいのですが、下記を読み下していただけないでしょうか。 (変数のリスト) = map{/^"(.*)"$/ ? scalar($_ = $1, s/""/"/g, $_) : $_} ($tmp =~ /("[^"]*(?:""[^"]*)*"|[^,]*),/g); $tmpはカンマ区切りのテキストです。
- ベストアンサー
- Perl
use encodingによって正規表現の結果が変わる？
お世話になります。 webシステムで、画面入力値のチェックをperlで行っているのですが、今回、perlのバージョンアップ対応を行っており、ソース修正をしたところ、以下のような現象に悩まされて困っております。（本当のソースはもっと長いのですが、以下の現象により入力チェックが正常に動作しないという点までは突き止めました。）バージョン perl v5.8.0 os Red Hat Linux release 9 現象 use encodingが指定されていると、正規表現の$が効かないようです。ソースと実行結果１ #!/usr/bin/perl #use encoding "euc-jp"; if ('apple' =~ /e$/) { print ("match\n"); } else { print ("unmatch\n"); } このときは match と表示されます。ソースと実行結果２ #!/usr/bin/perl use encoding "euc-jp"; if ('apple' =~ /e$/) { print ("match\n"); } else { print ("unmatch\n"); } このときは、unmatch と表示されます。対処方法のヒントだけでも頂けると助かります。（他の質問を検索してみましたが、同様なものを見つけることができませんでした。）もしかして、perlのバグなのでしょうか？
- ベストアンサー
- Perl
#!/usr/local/bin/perlで命令が出せません。
プログラミングのド素人で、独学でwindows上でcygwinを使っている者から質問させていただきます。「#!/usr/local/bin/perl」というコマンドをプログラムの先頭に書いて、[ファイル名]を入力してcygwinで命令をしたところ、命令が実行できず、「commond not found」と出てしまいました。そこで、ネット上で、いろいろ調べて、試してみたのですが、どうしても、解決できません。どなたか、アドバイスをいただけないでしょうか？ちなみに、perl [ファイル名]では、命令を実行することができます。「type -a perl」というコマンドを入力すると、「/cygdrive/c/Perl/bin/perl」というのがでてきたので、「#!/cygdrive/c/Perl/bin/perl」というコマンドを書いても上手くいきませんでした。ちなみに、私が書いたプログラムは、以下のようなものです。 #!/cygdrive/c/Perl/bin/perl　(あるいは#!/usr/local/bin/perl) # hello -- 挨拶のプログラム print ("hello");
- ベストアンサー
- Perl
正規表現でのエラー
検索システムを作ろうと思っています。テキストファイル(このソースではgreetings.txtです。)の中にある文章をキーボード入力で１文字でもヒットすれば抜き取って表示させたいのですが、以下のソースをコマンドプロンプトで実験したところ「Ｑ、Ｙ，Ｓ，Ｍ、と記号」で検索すると全ての文章がヒットしてしまいます。他の文字では問題無くヒットするのですが…。perlを始めてばかりでまだまだわからないことだらけです。いちおう本やネットで検索したんですがさっぱりわかりません。どなたかどうかお力を貸していただけませんか？ #!C:\Perl\bin\perl $kensaku = <>; $ans = eval $kensaku; open(IN, "greetings.txt"); while ($line = <IN>){ if($line =~ /$ans/i){ print "$line"; } }
- ベストアンサー
- Perl
正規表現の\Gの使い方
正規表現の\Gの使い方で質問です。ものの本によると、\Gをつけるとパターンマッチは前回の処理の続きから行われるとのこと。すると以下のようなコードなら、 ta tb tc td te となるべきと思われます。ところが実際は ta ta ta ta ta 明らかに\Gは無視されて、毎回$testの先頭から処理が行われています。どこに間違いがあるのでしょうか。 #! c:/perl/bin/perl $test='tatbtctdtetftg'; for($i=0;$i<5;$i++) { $test=~/(\Gt.)/; print $1."\n"; }
- 締切済み
- Perl

正規表現についての質問です。

みんなの回答

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

正規表現についての質問です。

みんなの回答

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録