正規表現で日本語文字化け

2008/04/30 11:56

noname#60065の回答

ベストアンサー

noname#60065

2008/04/30 20:23 回答No.3

>if /(\w+)\s+(\d+)/e =~line このeはeucのeです。これを付けると$KCODEの値に関係なくeucとして扱われてしまいます。参考URLのオンラインリファレンスをお読みください。

参考URL：: http://www.ruby-lang.org/ja/man/html/_A5EAA5C6A5E9A5EB.html#a.c0.b5.b5.ac.c9.bd.b8.bd.a5.ea.a5.c6.a5.e9.a5.eb

質問者

お礼 2008/04/30 21:46

ありがとうございます。正規表現部分はサンプルコードをそのまま打っており、全く気がつきませんでした（$KCODEの指定以外の理由が思いつきませんでした）ご丁寧にありがとうございます

この回答がついた質問に戻る

回答全件

#!/usr/bin/ruby -Ks i = 0 menu = …

- sakusaker7
2008/04/30 16:40

>if /(\w+)\s+(\d+)/e =~line なんで e …

- sakusaker7
2008/04/30 12:15

関連するQ&A

ソースで日本語を文字化けさせるには。。？
ブラウザの編集→ソース表示　から　ＨＴＭＬのソースを表示した際に、日本語の部分を文字化けさせたいのですが。方法は　metaタグを　charaset=EUC-JP　にするだけで良いのでしょうか？これを自分のサイトでやってみたところ、ソース表示でソースを見てみても　日本語部分が文字化けさせず普通に読めました・・。作った本人なので文字化けしないなどではないですよね。。お知りの方　よろしくお願いします。　
- ベストアンサー
- ブログ
正規表現について教えてください
こんにちは。 PHPの正規表現を使用して、あるサイトのhtmlソースから特定のタグ間にある文字を抜き取りたいです。例えば、下記の場合9を抜き取りたいです。 <div class="a">9</div> この場合の処理方法を教えてください。
- 締切済み
- PHP
Dreamweaverで文字化け！
教えてください。困っています。昨日やっとのことで作ったファイルが、今日修正をかけようと思いDreamweaver4で開けてみると、文字化けしてしまってめちゃくちゃになったいました。ファイルは2つ作ったのですが、１つだけがおかしくなっています。デスクトップ上からダブルクリックでファイルを開くと、正常ですが、Dreamweaver4で開けると文字化けしています。ソースを見るとソースも文字入力した部分が文字化けしています。Ｆ12を押してブラウザで見てみると中国語みたいになっています。ど～したらいいのでしょうか。教えてください。
- 締切済み
- その他(ソフトウェア)
|。ってなんですか？　正規表現
正規表現の学習中です。読んでいる本の中に次の式がありました。　(?<=^|。)[^。]+。日本語の文章の中から一文を抽出するための正規表現です。　。以外の文字がダーッと連なった後に。が来る文字列とのことです。　[^。]は。以外の文字　+はそれが１個以上あるですから　[^。]+ は　。以外の文字が１個以上あるという意味です。その後に。が付きますから、　[^。]+。だけで　。以外の文字がダーッと連なった後に。が来る文字列ということになります。では　(?<=^|。) の意味は何でしょう。　(?<=なんたら) は後方参照を意味しますから、 ^|。のすぐ後に [^。]+ が続くと言いたいのでしょうか。だとすると　^|。が問題です。　^もしくは。という意味なら、＾は正規表現で記号として使われている文字ですから、　\^|。と表現されそうなものです。それに、。は文末でしか利用されない文字ですから、これに注目して検索を行うというのは理解できますが、^は日本語でなんら特徴を持つ文字ではありません。　^もしくは。という理解は間違いでしょう。それでは^を記号として考えるとして、その前後を[]で囲んでいないから、この^は文字列の先頭を表すのでしょうか。そうすると件の正規表現は　先頭の|。のすぐ後から。以外の文字が連なった後に。が来る文字列という意味になります。日本語の一文を抽出する正規表現という解説にかなり近づいてはいます。しかし　|。とは一体何？ |はorを意味する記号ですが、　何とか or 。という意味でしょうか。でも「何とか」は「何とか」なりに何か文字表現がなされていても良さそうですし、それに　先頭の「何とか」または。のすぐ後から・・・という解釈は意味不明。　|。はどのように解釈すべきなのでしょうか。お手数をお掛けします。
- ベストアンサー
- Perl
正規表現
正規表現で数値と半角記号（!#$%()~|-^@[;],./`{+*}_）が入っているというものを表現したいのですが、、、下記のような正規表現をすると、エラーになってしまいます。何かよい方法はありませんか？ ^[a-zA-Z0-9\-_!#$%()~|-^@[;],./`{+*}_]*$ 又、携帯電話のチェックをしたいのですが、１文字以上の文字列があってというような処理にしたいのですが、何かよい方法はないでしょうか？ ereg( "@docomo\.ne\.jp$", $email )
- ベストアンサー
- PHP
正規表現：　　(111)-(222)-(333)
正規表現：　　(111)-(222)-(333) から (333)を取得したいと考えています。（）で囲まれた数字のうち、最後のものを取得するというもので、この、最後のという考えを実装することができずに困っています。なぜ最後にこだわるかというと、以下のような例があるからです。 ◆　(111)english(222) ◆　(111)日本語(222)日本語文字列中に含まれる（）で囲まれた数字のうち、最後のものを取得する正規表現を教えてください。
- 締切済み
- その他([技術者向] コンピューター)
正規表現
正規表現について勉強中です。先頭２文字をたとえばYQで入力させたい場合はどうマッチさせればよいのでしょうか？ if string.match(/^YQ|[0-9]/) == null { nullの場合の処理 } としていますが、うまくいきません。正規表現についてはまったくの初心者ですので、笑わないでくださいね。
- ベストアンサー
- JavaScript
ActivePerl5.8で日本語を使いたい
ActivePerl5.8の日本語処理で困っています。 EUCで書かれたのHTMLファイルに、タグの修正などの文字列処理をしているのですが、＊その結果をshift-jisで出力したい。＊コマンドライン上の文字も文字化けさせずに表示したいというあたりで困っています。 use encoding 'shiftjis'; binmode STDERR, ':encoding(shiftjis)'; という記述を書けばＯＫという記述を見たため試したのですが、うまく動きません。記述を外して、ソースをeucで書くと、コマンドライン表示以外はうまく動くのですが、他の組み合わせですと、日本語の文字処理がうまく行かかかったり、perl自体が落ちたりと、試行錯誤の連続です。文字処理というのは例えば、以下のような感じです。 print $mytitle; if ($mytitle =~/(【.*?】)/){ $subtitle = "<div class=\"head2\">$1<\/div>\n"; } （【】で囲んだ文字だけに特定のスタイルを効かせる。）文字列処理とコマンドラインも文字化けの双方を解決させる手立てを教えて頂ければと思います。よろしくお願いします。
- 締切済み
- Perl
文字化け
現在、ＷｉｎＸＰの英語版を使っています。日本語のソフトを使いたくて、インストールしたんですが、文字化けしてて全く文字が読めません。英語版でも日本語のソフトを使えるような文字化けを直してくれるフリーのソフトウェアはあるでしょうか？困っていますよろしくお願いします。
- 締切済み
- Windows XP
split() 正規表現
正規表現で / (スラッシュ)　.(ドット)にマッチ正規表現により文字列を分割し、配列に格納する split("[/\.]" $v)としていましたが split関数が使えなくなるので、変わりの方法を考えていますが preg_split()などではうまくいきませんでした。何か方法を教えて下さい。
- ベストアンサー
- PHP

正規表現で日本語文字化け

noname#60065の回答

お礼 2008/04/30 21:46

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

正規表現で日本語文字化け

noname#60065の回答

お礼 2008/04/30 21:46

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

カテゴリ
一覧

専門家に質問してみよう
専門家登録