ベストアンサー

mb_eregを使っての文字列検索、抽出について

2008/03/04 16:43

パターン="関数.+ます。" 上記パターンで、"関数"から"ます。"までを含む文字列を抽出する事は出来ました。が、一番最初に出てくる"ます。"で検索をストップし、変数$matchに代入する事はできますか？ (指定したキーワード"関数"以降の全ての"ます。"が変数に代入されてしまいます、最初に出てくる"ます。"まで抽出できれば充分なので。) キーワードやアドバイスがあればお教え下さい。宜しくお願いします。以下のプログラムで実行しました。 <?php //mb_eregについて $url="http://jp2.php.net/mb_ereg"; //アドレス指定 $result=file_get_contents($url);//取得 $text_contents=strip_tags($result);//タグを外す $sjis_text=mb_convert_encoding($text_contents,"SJIS","auto");//sjisに変換 echo("$sjis_text ");//本文出力 echo("---------------------------------------------- "); if(mb_ereg("関数.+ます。",$sjis_text,$match))//"関数"から"ます。"まで検索 echo("$match[0] ");//検索結果表示 ?>

narusuji
お礼率57% (76/132)

PHP
回答数2
ありがとう数3

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

yambejp
ベストアンサー率51% (3827/7415)

2008/03/04 17:00 回答No.2

こんなかんじでしょうか？ <? mb_regex_encoding("SJIS"); $text="これは関数ざます。そうざます。"; if(mb_ereg("関数.+?ます。",$text,$match)) print "${match[0]} "; ?>

質問者

お礼 2008/03/04 17:28

サンプルコードまで書いて頂きありがとうございます。実行した所無事解決する事が出来ました。ありがとうございます！

その他の回答 (1)

SAYKA
ベストアンサー率34% (944/2776)

2008/03/04 16:51 回答No.1

それは　最短一致　というやつだね。 http://www.google.co.jp/search?q=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%20%E6%9C%80%E7%9F%AD%E4%B8%80%E8%87%B4%20php&hl=ja&lr=lang_ja

質問者

お礼 2008/03/04 17:27

最短、最長一致と言う言葉を知りませんでした。目からうろこのキーワードでした、ありがとうございます。おかげ様ですぐに解決する事が出来ました。

関連するQ&A

ereg_replaceの文字化け
すみませんが、どなたか教えて下さい。漢字をひらがなにしたいと思い、 SJISファイルの以下のソースで、 mb_internal_encoding('SJIS'); mb_regex_encoding('SJIS'); $str = "除かれた"; echo ereg_replace("除[かきくけこ]","のぞ",$str); 結果を「のぞかれた」となるようにしたいのですが、上記だと、「のぞゥれた」となってしまいます。どうすれば直せるか分かる方はいらっしゃるでしょうか？
- ベストアンサー
- PHP
【ＰＨＰ】「ereg_match」はなぜ不人気なのか？
ＰＨＰ初心者です。現在ファイルの中を英語や日本語で検索するプログラムを作っています。検索といえば「preg_match」が一番人気あるように見えます。しかしたとえば、 mb_internal_encoding("UTF-8"); mb_regex_encoding("UTF-8"); if(preg_match( '/我輩は.である/' ,'我輩は猫である')){ print "マッチ！"; } 上記のような使い方をすると「.」は「猫」にマッチせず「...」にするとようやくマッチします。「preg_match」はマルチバイトに対応していないのでしょうか。そこでマルチバイトと正規表現に対応した検索関数「mb_ereg_match」を知りました。 if(mb_ereg_match( '我輩は.である' ,'我輩は猫である')){ これなら正常にマッチします。がしかし…　「mb_ereg_match」は全然辞書に載ってません。分厚いＰＨＰ辞書をいくつも持ってますが「ereg_match」すら載ってません。何か不人気の理由があるのでしょうか？気に入ったのに不安で使えません。お詳しい方、解説よろしくお願いいたします。
- 締切済み
- PHP
文字列のエンコードについて
例えば以下のコードで日本人がターゲットのサイトを作ったときにエンコードがutf8以外ってありますか？idなどもutf8でなんとかなるのになぜ他の文字コードは必要なのですか？ //SJISに変換 $str = "私のidはrxxdtggb63332224667です。"; $result = mb_convert_encoding($str, "SJIS"); echo $result . "\n"; //UTF-8に変換 echo mb_convert_encoding($str, "UTF-8"); //SJISに変換 $str = "gcdddyyghgcc.jpg"; $result = mb_convert_encoding($str, "SJIS"); echo $result . "\n"; //UTF-8に変換 echo mb_convert_encoding($str, "UTF-8");
- ベストアンサー
- PHP
mb_ereg_replaceに関して
こんにちは。お世話になっております。開発時（PHP5.1.4）では何ら問題なかったものが、レンタルサーバー上（PHP5.0.4）へアップロードしたら、mb_ereg_replace関数の部分でエラーが出て対処に困っております。エラー文 Call to undefined function mb_ereg_replace() $key = $_GET['key']; $key = addslashes($key); $key = mb_convert_encoding($key, 'EUC-JP', 'auto'); $key = mb_ereg_replace("　", " ", $key);//ココでエラー $arr = explode(" ",$key); 上記は実際のソースの一部ですが、GETで渡された文字列(検索キーワード、key=○○)をDB(MｙSQL)に登録のあるデータを検索する。といった結果を願い設置しております。借りたサーバ（共有）は、（適切な言葉じゃないかも知れませんが）PHPはCGIのもと動かしているようですが、これも原因の一つなのでしょうか？お忙しいなか恐縮ですが、ご指導のほど宜しくお願い申し上げます。
- ベストアンサー
- PHP
preg_match・ereg_replaceの動作について
preg_matchとereg_matchの動作について調べています。下記のスクリプトを実行すると、$stringが「代入テスト」となります。 ------------------------------------------- $v_insert = "代入" $string = "{%v_insert}テスト"; while (preg_match("/\{%(.*)\}/U", $string, $match)){ $string = ereg_replace($match[0], $$match[1], $a_subject); } ------------------------------------------- $$match[1]→$($match[1])→$(v_insert)となり、 $match[0]→/\{%(.*)\}/U $match[1]→v_insert $$match[1]→代入となるのは分かったんですが、なぜ、$match[0]→/\{%(.*)\}/Uで$match[1]がv_insertになるのかが分かりません。このスクリプトはどのように動き、どのように変数に値が設定されているのでしょうか。
- ベストアンサー
- PHP
ereg_match関数について
こんばんは。PHP初めて間もないド素人です。とあるサイトを参考に、バイナリセーフ関数とかいうのととそうでない関数の処理の違いを検証してみようと思い、以下のコードを試してみました。 <?php //preg_match関数がバイナリセーフ関数である事を検証する。 //正規表現文字列にマッチしない文字があれば１を返す。 $kekka=preg_match('/[^a-zA-Z0-9_]/','oh_my_god\x00@'); $kekka2=ereg_match('/[^a-zA-Z0-9_]/','oh_my_god\x00@'); print($kekka); print(" "); print($kekka2); ?>  <?php print_r($kekka); ?> これを試した結果、 Fatal error: Call to undefined function ereg_match() ...... というエラーがでました。ereg_match関数についてインターネットで調べてみたのですがヒット率が異常に悪く「もしかしてpreg_match?」とか表示されたりもしました。今php5を使ってますが、もしかしてこの関数はもうなくなった関数なのでしょうか？
- ベストアンサー
- PHP
PHPの正規表現　メール受信と文字コードについて
Yahooのメールサーバに接続しメールを取得、メール本文に特定の語句が含まれているか調べたいのですが、うまく行かず悩んでいます。 SJIS文字コードが原因なんでしょうか？かなり長い文章になるので、お暇でしたらご教授下さい。 PHP Version 5.2.5です。以下のプログラムでの問題点です。 <?php $mb=imap_open("{pop.mail.yahoo.co.jp:110/pop3}INBOX","ID","pass") or die("メールボックスを開けません "); $i=4;//メール番号 //imap_fetchbody、mb_convert_encodingで取得した変数<$body_sjis>と比較する為、メール本文を変数<$mail_honbun>としてファイル内に定義。 $mail_honbun="次のことはを感じで、書きなさい。（すべて）手へんの漢字です。「正解」はこのあとすぐ。仕上げの湾カールが決まるのは：エッセンシャルダメージケア新発売"; $body=imap_fetchbody($mb,$i,1,FT_PEEK);//本文取得 $body_sjis=mb_convert_encoding($body,"SJIS","auto");//SJISに変換 echo("$body_sjis "); echo("[mail_honbunの場合] "); if(preg_match("/次の.+書きなさい。/",$mail_honbun,$temp))//OK echo("$temp[0] "); else echo("NOT MATCH "); if(preg_match("/次の.+正解/",$mail_honbun,$temp))//OK echo("$temp[0] "); else echo("NOT MATCH "); if(preg_match("/エッセンシャル/",$mail_honbun,$temp))//OK echo("$temp[0] "); else echo("NOT MATCH "); if(preg_match("/ダメージ/",$mail_honbun,$temp))//NG 何故ダメージはマッチしない？ echo("$temp[0] "); else echo("NOT MATCH "); echo("--------------------------------------- "); echo("[body_sjisの場合] "); if(preg_match("/次の.+書きなさい。/",$body_sjis,$temp))//OK echo("$temp[0] "); else echo("NOT MATCH "); if(preg_match("/書き.+正解/",$body_sjis,$temp))//NG 。を超えるとマッチしない echo("$temp[0] "); else echo("NOT MATCH "); if(preg_match("/エッセンシャル/",$body_sjis,$temp))//OK エッセンシャルはOK echo("$temp[0] "); else echo("NOT MATCH "); if(preg_match("/ダメージ/",$body_sjis,$temp))//NG ダメージがNG、何故？ echo("$temp[0] "); else echo("NOT MATCH "); ?> ## 結果 ######################################################## [mail_honbunの場合] 次のことはを感じで、書きなさい。次のことはを感じで、書きなさい。（すべて）手へんの漢字です。「正解エッセンシャル NOT MATCH --------------------------------------- [body_sjisの場合] 次のことはを感じで、書きなさい。 NOT MATCH エッセンシャル NOT MATCH ################################################################# 問題点<$mail_honbun>の場合マッチするカタカナと、しないカタカナがある事。(エッセンシャルがマッチして、ダメージがマッチしない事) 問題点<$body_sjis>の場合。を超えるとマッチしない事。マッチするカタカナと、しないカタカナがある事。(エッセンシャルがマッチして、ダメージがマッチしない事) 自分で何が問題なのか、何を知らないのかがはっきりしません。文字コードSJISを使わない方がいいのでしょうか？参考になる事や、調べたら解決しそうなキーワードがあれば教えて下さい。宜しくお願いします。ファイル"php.ini"の設定 mbstring.language = Japanese mbstring.internal_encoding = SJIS mbstring.http_input = auto mbstring.http_output = SJIS mbstring.encoding_translation = On mbstring.detect_order = SJIS,EUC-JP,JIS,UTF-8,ASCII
- ベストアンサー
- PHP
文字コード(UTF-8)文字化けについて
以下のphpを実行したところ、入力した文字によって文字化けしたりしなかったりします。どなたか原因が分かる方がいらっしゃったら教えてください。（見、一は化けない。上、実は化ける。） phpはバージョン5.2.8を使用しています。（コード）----------------------- <html lang="ja"> <meta http-equiv="Content-type" content="text/html; charset=UTF-8" /> <head> </head> </body> <?php mb_language("Japanese"); mb_internal_encoding("UTF-8"); $org_text1 = "見"; $org_text2 = "上"; $org_text3 = "実"; $org_text4 = "一"; $telop_text1 = mb_convert_encoding($org_text1,'utf-8','ASCII, JIS, EUC-JP,SJIS'); $telop_text2 = mb_convert_encoding($org_text2,'utf-8','ASCII, JIS, EUC-JP,SJIS'); $telop_text3 = mb_convert_encoding($org_text3,'utf-8','ASCII, JIS, EUC-JP,SJIS'); $telop_text4 = mb_convert_encoding($org_text4,'utf-8','ASCII, JIS, EUC-JP,SJIS'); echo "telop_text1="; echo $telop_text1; echo " "; echo "telop_text2="; echo $telop_text2; echo " "; echo "telop_text3="; echo $telop_text3; echo " "; echo "telop_text4="; echo $telop_text4; ?> </body> </html> （結果）------------------------- telop_text1=見 telop_text2= telop_text3=タ telop_text4=一
- ベストアンサー
- PHP
ereg_replaceの文字化けについて
宜しくお願いします。 PHPで文字列の置き換えをする関数の『ereg_replace』についてですが、この関数を使う変数に『'』がはいると、置き換え後にその『'』の前に『\』が付いちゃうんですが、これを回避する方法は無いでしょうか？ちなみに、文字化けするソースを明記させて頂きます。 $title_edit = ereg_replace("/\x0D\x0A|\x0D|\x0A/"," ","${title}"); 入力フォームでtextareaで入力された項目が$titleに入るのですが、textarea内でエンター改行した場合に、その改行コードをHTML上の タグに置き換えるというものなんですが、これを行うと、『'』の前に『\』が入ってしまうのです。原因が良く判らないで困っています。お願いします！教えて下さい！！
- ベストアンサー
- PHP
mb_ereg_replace関数の正規表現
PHPでmb_ereg_replace関数を使って、任意の文字列から文字列"あい"でない文字を抽出したいと考えております。その際に、[^あい]と記述すると、"あ"又は"い"でない文字を抽出することになり目的を果たせません。就いては、ブラケット内で文字列を扱う方法の有無および、あるのであればその方法、ないのであればその代替案をご教示いただきたくお願い申し上げます。
- ベストアンサー
- PHP

mb_eregを使っての文字列検索、抽出について

質問者が選んだベストアンサー

お礼 2008/03/04 17:28

その他の回答 (1)

お礼 2008/03/04 17:27

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

mb_eregを使っての文字列検索、抽出について

質問者が選んだベストアンサー

お礼 2008/03/04 17:28

その他の回答 (1)

お礼 2008/03/04 17:27

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録