• 締切済み

file_get_contents()にて文字化け

PHPにてfile_get_contents()関数を使用し、ソースを読み込んだのですが、文字化けしてしまいます。 ※読込先は海外サイトです。日本語は利用されていません。 エンコードの問題かと思い、試行錯誤しましたが、うまくいきません。 解決方法を教えてください。 ちなみに、ソースの読み込み事態はできているので、ユーゼエージェントで、はじかれていることはないと思います。 [相手サイトの情報] ・UTF-8を宣言している ・日本語は使用していない ※URLを$urlとします。 [ソース] header("Content-type:text/html;charset=UTF-8"); echo mb_convert_encoding(file_get_contents($url),'UTF-8','auto'); file_get_contents($url)単体でもアウトでした。 お願いしますm(_ _)m

  • PHP
  • 回答数1
  • ありがとう数0

みんなの回答

noname#244856
noname#244856
回答No.1

実際にURLを貼ってもらわないことには検証できないんですが・・・ $context = stream_context_create(array('http'=>array('header'=>implode("\r\n",array( 'User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:20.0) Gecko/20100101 Firefox/20.0', 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Language: ja,en-us;q=0.7,en;q=0.3', 'Accept-Encoding: gzip, deflate', ))."\r\n"))); file_get_contents($url,false,$context); とりあえずこれで試してみてください。

drunbarunba
質問者

補足

ご回答ありがとうございます! 早速試してみましたが、だめでしたorz それ以前にどうやら、 file_get_contents($url); 単体でも機能するけれど、 文字化けしたりしなかったりするようです。 何か解決方法ありますでしょうか。

関連するQ&A

  • file_get_contents()で文字化けしてしまう

    file_get_contents()で文字化けしてしまう お世話になります。 職場の環境でプロキシ経由でないと外部ファイルを読み込めないということなので プロキシ経由でファイルを読みこもうとして http://blog.umeyama.org/2009/06/php-proxy.html を参考に $csvscj="http://xxxx/yyy/zzz.csv"; $proxy = array( "http" => array( "proxy" => "tcp://proxy:port", "request_fulluri" => true, ) ); $sc = stream_context_create($proxy); $FileList=file_get_contents($csvscj,false,$sc); $FielList = mb_convert_encoding($FielList, "UTF-8", "SJIS"); echo '$FileList='.$FileList; $csvscjはShiftJISのcsvファイルです。 このようにechoで$FileListを表示してみると、半角文字以外は文字化けしてしまいます。 mb_convert_encoding()をレム文にしても同じ結果です。 よろしくお願いいたします。

    • ベストアンサー
    • PHP
  • file_get_contentsがうまくいかない

    echo $url2 = 'https://go.jp/servicef/112233'; echo $scrape2 = file_get_contents($url2); であれば上手くいきますが $aa = '112233'; echo $url2 = 'https://go.jp/servicef/'.$aa; echo $scrape2 = file_get_contents($url2); とした場合うまくいきません。原因わかる方いないでしょうか??

    • 締切済み
    • PHP
  • file_get_contentsでのデータ挿入

    file_get_contentsで取得したHTMLに特定の文字列を挿入して出力したいです。 下記の実行ですと'0'が返ってきてしまいます。 どこが問題なのでしょうか? <?php $html_data = mb_convert_encoding(file_get_contents("http://www.yahoo.co.jp"),'UTF-8','auto'); $str = 'aaa'; $html_data += $str; print($html_data); ?>

    • 締切済み
    • PHP
  • file_get_contentsについて

    file_get_contentsについて教えてください。 現在あるサイトを定期的にチェックし、特定の文字列が存在したら メールを送るというものを作っています。 そのサイトチェックの際にfile_get_contentsを使って、 サイトの中身をチェックしています。 $tmpPage = file_get_contents('~.cgi?aa=bbb'); 上記の用に記述して$tmpPage内の文字列をチェックすることで 実現できているのですが、本来このサイトは携帯向けのページのため ヘッダー情報を付加して下記のように記述しています。 $opts = array( 'http'=>array( 'method'=>'GET', 'header'=>'Host :www.XXXXX.jp' . PHP_EOL . 'User-Agent :KDDI-XXXXXXXXXXXX' . PHP_EOL . 'x-up-subno :XXXXXXXXXXXX.ezweb.ne.jp' ) ); $context = stream_context_create( $opts ); $tmpPage = file_get_contents( '~.cgi?aa=bbb', false, $context ); このように記述すると Warning: file_get_contents('~.cgi?aa=bbb') [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.1 404 Not Found とエラーが返ってきてしまいます。 アクセスするURLをYahooやGoogleにすると問題なく動いているので、 問題なのはチェックするサイトのURLが「XXX.cgi?aa=bbb」と なっているのがダメなのではないかと思っています。 アクセス先のURLが単純な「.html」ではないまたは、ヘッダー情報を 付加する場合、file_get_contentsの使い方が変わるのでしょうか。 ご存知の方がいらっしゃれば是非教えてください。 よろしくお願いします。

    • 締切済み
    • PHP
  • file_get_contentsでなにもとれない

    file_get_contentsでなにもとれない $url = 'http://xxxxxxxxxx'; $html = file_get_contents($url ); echo $html; とした時何も表示されません 他のサーバーに移植したらとれるのでインフラの問題だと思うのですが何が考えられますでしょうか。 iptablesで外部にポート80あけてもだめでした。 ちなみにうったコマンドは iptables -A OUTPUT -p tcp -m state --state NEW --dport 80 -j ACCEPT iptables -A OUTPUT -p tcp -m state --state NEW --dport 443 -j ACCEPT

    • ベストアンサー
    • PHP
  • file_get_contentsでcss読み込み

    file_get_contentsで、<link rel="stylesheet" href="style.css">と同じことをやるにはどうすればよいのでしょうか? 結果をechoすると、同じこと? それとも、結果をechoするのは、htmlにcssを直書きする内部css扱いになるので、 <link rel="stylesheet" の外部cssとは異なる? css読み込めれば、「file_get_contents」でなくても良いです。 「include」とかでもcssを読み込めるのでしょうか?

    • ベストアンサー
    • PHP
  • str_get_htmlがこける原因を知りたい

    よろしくお願いします。 PHP であるサイトをスクレイピングしているのですが、str_get_htmlが特定?のページだけ処理が失敗します。 例えば、1ページ~10ページ目までをスクレイピングしているときに、8ページ目だけ失敗します。 str_get_htmlの処理に失敗する原因って何々あるんでしょうか? 以下は、サーバ・PHPの情報になります。 ・サーバ:さくらのレンタルサーバ スタンダード ・PHP -v 5.4.22 ・ソース $HTML = file_get_contents($url); $encode_HTML = mb_convert_encoding($HTML, 'UTF-8', 'CP932'); $Dom = str_get_html($encode_HTML); // ここで$Domに値がはいっていないのを確認しました。 // print_r($encode_HTML); はHTMLソースにはなってました。 if ($Dom){ echo "OK"; }else{ echo "NG"; continue; }

    • ベストアンサー
    • PHP
  • file_get_contents関数で引数をURLにすれば、HTML

    file_get_contents関数で引数をURLにすれば、HTMLソースを取得できるのはわかるのですが、 例えば、URLが制限 255バイト?を超える場合、GETでなくPOSTタイプでHTMLを取得したいのですが、file_get_contents関数のように手軽にPOSTタイプで取得できる関数はありますか? PHP5を使っています。

    • 締切済み
    • PHP
  • 「include」と「file_get_contents」の違いがよく

    「include」と「file_get_contents」の違いがよく分かりません。 ネットで調べてみました。 ・「include」… 指定したファイルを読み込んで評価 ・「file_get_contents」… 指定したファイルの内容を全て読み込んで文字列として返す で、実際に試してみたのですが、「file_get_contents」の方がよく分かりません。 具体的には、下記を試すと、結果が、tt string(44) "" となるのですが、ttって何ですか? 評価をしないで文字列として返したということでしょうか? それでなんで tt になるのでしょうか? ▼hoge.php <?php $s = file_get_contents("test1.php"); var_dump($s); ?> ▼test1.php <?php echo ("1どうなるのかな"); ?>

    • ベストアンサー
    • PHP
  • 日本語が文字化けしないよう読み込み

    特定ファイルにある複数行の日本語文章を 「fgets」や「file_get_contents」などで画面に読み込む時は、 単純に「mb_convert_encoding」を使えば 良いと思ったのですが 下記のようには文法的にも使えませんでした。 -------------------------------------- <?php $fp = fopen("sample.txt", "r"); $fp = mb_convert_encoding($fp, "UTF-8"); ←※間違い if($fp){ flock($fp, LOCK_SH); while(!feof($fp)){ $data = fgets($fp); echo "$data<br>"; } flock($fp, LOCK_UN); } fclose($fp); ?> -------------------------------------- すでに書き込んである 日本語が複数行書かれたファイルから 文字化けしないようにデータを読み込んで表示するには どのような処理をしたら良いのでしょうか? 複雑な処理はまだ理解できないので 簡単な処理方法があれば お教えください。 よろしくお願いいたいます。

    • ベストアンサー
    • PHP