ベストアンサー

mb_ereg_replace　での文字変換

2009/08/04 12:48

PHPでフリーの掲示板を制作中です。目立たせようとする記号を削除しましたがうまく動きません。 $html = mb_ereg_replace('△', '', 'あああ△あああ'); ・希望結果　ああああああ・実際の結果　ああ文字コードは全て EUC-JP です。また以下を追加するとエラーがでました。 $str="あああ△あああ"; $str = mb_convert_encoding($str, 'EUC-JP', 'auto'); ・エラー Warning: mb_convert_encoding() [function.mb-convert-encoding]: Unable to detect character encoding in そもそもmb_convert_encodingを使わない方が良いのか使い方が悪いのかも解りませんがアドバイスお願いします。

tantamu
お礼率84% (11/13)

PHP
回答数5
ありがとう数5

みんなの回答 （5）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

UmJammer
ベストアンサー率58% (115/196)

2009/08/04 13:32 回答No.2

正規表現用の文字コードは指定されていますか？これをEUC-JPに設定しておかないと正しく動作しないでしょう。 php.iniなどでmbstring.internal_encodingの値をEUC-JPにするか、mb_regex_encoding関数でEUC-JPを指定してみてください。 http://jp2.php.net/manual/ja/function.mb-regex-encoding.php http://jp2.php.net/manual/ja/function.mb-ereg-replace.php

質問者

お礼 2009/08/04 23:17

下記でうまくいきました。助かりました。 mb_regex_encoding( "EUC-JP" ); $html .= mb_ereg_replace('△', '', 'あああ△あああ'); // 文字化け

その他の回答 (4)

okmotokun
ベストアンサー率59% (92/155)

2009/08/04 15:40 回答No.5

No.4です。No.3のSortaNerdさんと同じになってしまいました。それで、 $html = str_replace("(?<!\xA4)△", '', 'あああ△あああ'); なんていう場合は実際にはあまり出現しないと思いますが、preg_replaceを使えばＯＫだと思いますよ。 $html = preg_replace("/(?<!\xA4)△/","","あああ△あああ");

質問者

お礼 2009/08/04 23:21

これも無事に動きました。有り難うございました。実際には使用者が自由に追加できるようにしたいので、色々試してみたいと思います。有り難うございました。

okmotokun
ベストアンサー率59% (92/155)

2009/08/04 15:21 回答No.4

$html = mb_ereg_replace('△', '', 'あああ△あああ'); でも $html = str_replace('△', '', 'あああ△あああ'); でも EUCでなければ（SJISかUTF8なら）うまくいきます。というのは、 △ は \xA2\xA4 あは \xA4\xA2 ですから、 \xA4【\xA2\xA4\xA2\xA4】\xA2【\xA2\xA4】\xA4【\xA2\xA4\xA2\xA4】\xA2 のように、「あ」の2バイト目と、次の「あ」の1バイト目が \xA2\xA4 ですからマッチしてしまい、【】のところが削除され、「あ」が２字残るわけです。

質問者

お礼 2009/08/04 23:19

文字コードは思わぬ結果になるんですね。勉強になりました。有り難うございました。

SortaNerd_
ベストアンサー率59% (309/522)

2009/08/04 15:05 回答No.3

phpには詳しくないのですが、とりあえず文字コードの問題であるのは確かなようです。 EUC-JPでは △ → A2 A4 あ → A4 A2 というコードですので、あああ△あああ → A4 A2 A4 A2 A4 A2 A2 A4 A4 A2 A4 A2 A4 A2 → A4 (A2 A4) (A2 A4) A2 (A2 A4) A4 (A2 A4) (A2 A4) A2 → A4 A2 A4 A2 → ああとなっているようです。状況から見るに、文字コードがShift_JISと判断されているように思います。 Shift_JISではA2は半角"「"、A4は半角"、"とそれぞれ1バイト文字に割り当てられていますので。

質問者

お礼 2009/08/04 23:15

適当に打ち込んだテスト文字が偶然にこうなるとは… 勉強になりました。有り難うございました。

yambejp
ベストアンサー率51% (3827/7415)

2009/08/04 12:52 回答No.1

ereg系の関数は使用しない方がよいでしょう。これは単にstr_replaceでよいような気がします。 $html = str_replace('△', '', 'あああ△あああ'); print $html;

質問者

補足 2009/08/04 13:09

早速の回答有り難うございました。しかし、同じ結果になってしまいました。設定の問題なんでしょうか… ローカルでもサーバー（さくらインターネット）でも同じでした。 $html = str_replace('△', '', 'あああ△あああ'); ・実際の結果　ああ

関連するQ&A

mb_ereg_replaceに関して
こんにちは。お世話になっております。開発時（PHP5.1.4）では何ら問題なかったものが、レンタルサーバー上（PHP5.0.4）へアップロードしたら、mb_ereg_replace関数の部分でエラーが出て対処に困っております。エラー文 Call to undefined function mb_ereg_replace() $key = $_GET['key']; $key = addslashes($key); $key = mb_convert_encoding($key, 'EUC-JP', 'auto'); $key = mb_ereg_replace("　", " ", $key);//ココでエラー $arr = explode(" ",$key); 上記は実際のソースの一部ですが、GETで渡された文字列(検索キーワード、key=○○)をDB(MｙSQL)に登録のあるデータを検索する。といった結果を願い設置しております。借りたサーバ（共有）は、（適切な言葉じゃないかも知れませんが）PHPはCGIのもと動かしているようですが、これも原因の一つなのでしょうか？お忙しいなか恐縮ですが、ご指導のほど宜しくお願い申し上げます。
- ベストアンサー
- PHP
ereg_replaceの文字化け
すみませんが、どなたか教えて下さい。漢字をひらがなにしたいと思い、 SJISファイルの以下のソースで、 mb_internal_encoding('SJIS'); mb_regex_encoding('SJIS'); $str = "除かれた"; echo ereg_replace("除[かきくけこ]","のぞ",$str); 結果を「のぞかれた」となるようにしたいのですが、上記だと、「のぞゥれた」となってしまいます。どうすれば直せるか分かる方はいらっしゃるでしょうか？
- ベストアンサー
- PHP
配列をmb_ereg_replaceで一気に置き換えるには？
お世話になります。 mb_ereg_replace関数を使い文字の置き換えを行っているのですが、置き換えるものが多く、1回で置き換えられないかと思い、質問をさせて頂きます。 // 検索文配列 $search = array("__tome__", "__hame__", "__hoge__"); // 置き換え文配列 $replace = array("$tome", "$hame", "$__hoge__"); // 置き換え $str = mb_ereg_replace($search, $replace, $str1); とやると Warning: mb_ereg_replace() expects parameter 2 to be string, array given in on line というエラーが出てしまい、うまく置き換える事が出来ません。どのようにすればうまく置き換えられるでしょうか？ご教授のほどよろしくお願いします。
- ベストアンサー
- PHP
文字コード変換
初心者で、どう質問をすれば理解してもらえるか分かりませんが、文字コードを出力先に合わせて "EUC-JP"と変換していのですがうまい事いきません。 <?php $str = "あああ"; $str = mb_convert_encoding($str, "EUC-JP", "auto"); echo $str; ?> というふうに書いても Fatal error: Call to undefinde function mb_convert_encoding() と出てきて、エラーがおきてしまいます。ちなみにMS-DOSを使用してます答えれる事は何でも答えますので何か、ほかに方法があれば教えてください。お願いします。
- 締切済み
- PHP
mb_ereg_replaceについて
マルチバイトでの置き換えについて質問です。現在は以下のように str_replaceで置き換えしており文字化けはないのですがマルチバイト対応のmb_ereg_replaceで実行したほうがいい事を知りました。以下現在のソースです。 // 検索文配列 $search = array("{#aaa#}", "{#bbb#}", "{#ccc#}"); // 置き換え文配列 $replace = array("あああ", "いいい", "ううう"); // 置き換え $str = str_replace($search, $replace, $str); 単純にstr_replaceをmb_ereg_replaceにしてみたのですがエラーになってしまいました。置き換えしたい文字が複数あるのでできれば検索文字、置き換え文字を配列として使用したいのですがどうすればいいのでしょうか？ちなみにですが文字コードはutf-8です。
- ベストアンサー
- PHP
Shift-JISからUTF-8への変換が出来ません
初歩的な質問で申し訳ありませんが、大変困っております。ただいまimagettftext()を使って日本語主力したく悪戦苦闘しております。　ページ自体はShift-JISで制作していますのでimagettftext()で日本語を出力する場合はUTF-8へ変換して出力するところまでは知れべていて分かりました。しかしいざmb_convert_encoding()で変換しようとするとなぜかUTF-8へ変換されません。 $str = mb_convert_encoding($str,"UTF-8","SJIS"); print mb_detect_encoding($str); 　結果→SJIS しかしこれがEUC-JPなら変換されます。 $str = mb_convert_encoding($str,"EUC-JP","SJIS"); print mb_detect_encoding($str); 　結果→EUC-JP なぜなのか原因が分からなく困っております。どなたかご教授願いませんでしょうか？よろしくお願い致します。
- 締切済み
- PHP
メールの内容が文字化けします・・・
<? function sendmail($to,$from,$from_name,$title,$message){ /* EUCコードへのエンコーディング */ $to = mb_convert_encoding($to , "EUC-JP","EUC-JP,UTF-8,SHIFT-JIS,ASCII,JIS"); $from = mb_convert_encoding($from , "EUC-JP","EUC-JP,UTF-8,SHIFT-JIS,ASCII,JIS"); $title = mb_convert_encoding($title , "EUC-JP","EUC-JP,UTF-8,SHIFT-JIS,ASCII,JIS"); $message = mb_convert_encoding($message , "EUC-JP","EUC-JP,UTF-8,SHIFT-JIS,ASCII,JIS"); /* 改行コード変換(CR+LFへ変換) */ $to = ereg_replace("\r", "", $to); $to = ereg_replace("\n", "\r\n", $to); $from = ereg_replace("\r", "", $from); $from = ereg_replace("\n", "\r\n", $from); $from_name = ereg_replace("\r", "", $from_name); $from_name = ereg_replace("\n", "\r\n", $from_name); $title = ereg_replace("\r", "", $title); $title = ereg_replace("\n", "\r\n", $title); $message = ereg_replace("\r", "", $message); $message = ereg_replace("\n", "\r\n", $message); /* メールヘッダ生成 */ $header = "From: ".$from_name." <".$from.">\n"; $header .= "Reply-To: ".$from_name." <".$from.">\n"; /* メール本文生成 */ $message = mb_convert_kana($message,"KV"); /* 送信メッセージ言語設定 */ mb_language("Japanese"); /* メール送信処理 */ $rcd = mb_send_mail($to,$title,$message,$header); return $rcd; } ?> 何が原因か分からないのです・・・。教えていただければ嬉しいですｍ(__)ｍ
- ベストアンサー
- PHP
全角の”’￥を半角に変換したい
PHPを勉強し始めた超初心者です。よろしくお願いいたします。表題のとおり、PHPにて全角の”’￥を半角の"'\に変換したいのですが、うまくできません。 ----- A ----- $s = "”’￥"; mb_convert_kana( $s, "as" ); 結果：全て全角のまま。 ----- B ----- $s = "”’￥"; $s = mb_ereg_replace( '”', '"', $s ); $s = mb_ereg_replace( '’', '\'', $s ); $s = mb_ereg_replace( '￥', '\\', $s ); 結果：”’は半角になるんですが、￥は半角になりません。なにか根本的に間違いがあるんでしょうか？あともう一つ、日本語環境について、 mb_language( "Japanese" ); mb_internal_encoding( "EUC-JP" ); mb_regex_encoding( "EUC-JP" ); mb_substitute_character( "none" ); mb_detect_order( "SJIS,EUC-JP,JIS,UTF-8,ASCII" ); と、ソースに指定しているのですが、ローカル環境がWindowsなので、ソースそのものはSJISになっていると思います。（コード体系管理できないテキストエディタ使用）しかしこれをそのままサーバーにアップしても、問題なく（文字化け等無く）print"サシスセソラリルレロ"; なども表示されるんですが、これはこれでいいんでしょうか？以上、よろしくお願いいたします。
- ベストアンサー
- PHP
mb_eregについて
初歩的な質問かもしれませんが、 DB内の1つのカラムに「a1,a3,a5,a7,a9」という値が格納されてる時、 if(ereg("a9",$str)){ echo "ok"; } という「ereg」を使った条件式でしたら、正常に値が返るのですが、 if(mb_ereg("a9",$str)){ echo "ok"; } と、「mb_ereg」を使用した時には「Call to undefined function: mb_ereg()」というエラーが返ってくるのですがこれは何が原因なのか、お分かりになる方はいらっしゃいますでしょうか？
- ベストアンサー
- PHP
PHP＋Postgres 「髙」が文字化け
DB上に格納した文字列を取得し、PHPで出力すると、「髙」（はしごだか）等、一部の文字が「□・」のような見た目に化けてしまいます。環境は以下です。 Linux(CentOS 5) PHP 5.1.6 Apache 2.2.3 PostgreSQL 8.4.3 文字コードは以下です。 Postgres：EUC-JP PHPソース：EUC php.ini の[mbstring]はコメントのまま変更していません。文字コードの変換を試してみたのですが、「髙」としては出力できませんでした。 Windows上では「CP51932」に変換すると正常に出力できましたが、Linux上ではやはり駄目でした。 mb_language("uni"); mb_internal_encoding("euc-jp"); mb_http_input("auto"); mb_http_output("euc-jp"); $str = "髙橋"; print(mb_convert_encoding($str, "EUCJP-win")); print(mb_convert_encoding($str, "EUCJP-win","EUC-JP")); print(mb_convert_encoding($str, "SJIS")); print(mb_convert_encoding($str, "SJIS","EUC-JP")); print(mb_convert_encoding($str, "SJIS-win")); print(mb_convert_encoding($str, "SJIS-win","EUC-JP")); print(mb_convert_encoding($str, "UTF-8")); print(mb_convert_encoding($str, "UTF-8","EUC-JP")); print(mb_convert_encoding($str, "EUC","SJIS")); print(mb_convert_encoding($str, "Unicode")); print(mb_convert_encoding($str, "Unicode","EUC-JP")); print(mb_convert_encoding($str, "UTF-8", "sjis-win")); print(mb_convert_encoding($str, "CP51932")); print(mb_convert_encoding($str, "MS932")); print(mb_convert_encoding($str, "MS932","EUC-JP")); print(mb_convert_encoding($str, "UTF-8","EUCJP-win")); print(mb_convert_encoding(mb_convert_encoding($str, "EUCJP-win" ), "UTF-8","EUCJP-win")); print(mb_convert_encoding(mb_convert_encoding($str, "EUCJP-win","EUC-JP"), "UTF-8","EUCJP-win")); print(mb_convert_encoding(mb_convert_encoding($str, "SJIS-win" ), "UTF-8","SJIS-win")); print(mb_convert_encoding(mb_convert_encoding($str, "SJIS-win","EUC-JP"), "UTF-8","SJIS-win")); print(mb_convert_encoding(mb_convert_encoding($str, "SJIS-win" ), "EUCJP-win","SJIS-win")); print(mb_convert_encoding(mb_convert_encoding($str, "SJIS-win","EUC-JP"), "EUCJP-win","SJIS-win")); http://blog.livedoor.jp/loopus/archives/50160285.html 上記サイトによると、解決法は「EUC-JPで出力しないこと」という事でしたが、文字コードを変換して出力できるような事を書いているサイトもあり、結論が出せずにいます。ソースを書き換えるのは避けたいのですが、いい方法がありましたらご教示ください。
- ベストアンサー
- PHP

mb_ereg_replace　での文字変換