• ベストアンサー

文字コードについて(小説サイトを運営しています)

HTML5が正式勧告されたら移行予定のため、文字コードを全てUTF-8に変更しました。 執筆速度が速いため、現在ある200ファイルほどを早めに変えておこうと思い、変えたのですが(Shift_JISは非推奨ですし、大手小説サイトの文字コードもUTF-8という理由です) スクリプトなど組み込むつもりのないテキストのみのサイトです。 今、悩んでおります。この場合、将来性を考慮した上で(Shift_JISが廃れてゆく可能性)どちらの文字コードにすべきでしょうか? 一部のページに環境依存文字を使用してあるだけです。 当方はHTMLの勉強中の作家です。現在、文字化け対策で悩んでおります。

noname#226929
noname#226929
  • HTML
  • 回答数3
  • ありがとう数4

質問者が選んだベストアンサー

  • ベストアンサー
noname#140045
noname#140045
回答No.2

HTML5だけでなく、時代はShift-JISやEUCに逆戻りすることはありませんから、もうUTF-8に変換したのならば、それをアップすればいいと思いますが、何か問題でもあるのでしょうか。

noname#226929
質問者

お礼

いえ…、日本語(たまに英単語も)のみのページUTF-8を使用することの是非について悩んでおります。 確かにドイツ語や環境依存文字を使用しているページもあります(UTF-8にすることにより正常に表示されるようになりました(全てアップロード済みです)。 Shift-JISから文字コードを変更するに当たり、私の周りのWebに携わる人に意見を聞いたところ、皆さん「UTF-8ねぇ…。Shift-JISのほうが…」と、あまり良い反応が返って来なかったことが少々気にはなりましたが、マイクロソフト社のHP然り、けっこうUTF-8のところが目立ち、ひょっとしてこれからはUTF-8が主流になるのでは?と判断してUTF-8に変更してから2ヶ月目ですが、特に文字化け等は起こっていないです。 それとこれだけグローバルな社会になってきておりますし…。 ただ、(記号は除いて)日本語のみのページもUTF-8で統一することにより、何か不都合はあるのか。それが気になってJISに戻すべきか悩んでおりました。 逆戻りすることはないんですね!安心しました(文字コード一括変換ソフトを使うと全ページが文字化けしてしまうため、手作業で変更したので、もし戻すのならば、ファイル数が膨大になる前に戻したほうが良いので検索をかけては悩んでおりました)。

その他の回答 (2)

  • Chaire
  • ベストアンサー率60% (79/130)
回答No.3

はっきり申し上げますが、馬鹿げています。 > Shift_JISは非推奨ですし そのような事実はありません。そもそも、XML が UTF-8/16 をデフォルト文字コードにしたのは、Unicode を経由することによって「全ての文字コード」を許容するため、もっと言えばページ制作者が文字コードで悩まないようにするためです。HTML5 もその流れに沿い「全ての文字コード」を許容します。 プログラマにとっては、Shift_JIS で多少の問題があるのは周知の通りです。ですが、質問者ご自身はページをプログラム処理する予定がないとのことですから、何の関係もありません。 もちろん、これから書くページはプログラムしやすく多国語文字も使える UTF-8 にする、という方針はアリです。しかし、それに合わせて過去の全てのページの文字コードを変更するのは、「制作者が文字コードで悩まないようにする」という XML の精神に反していますし、HTML5 とも無関係です。それは、単純に「統一されてないと気が済まない」という気持ちの問題でしかありません。 また、前回 <meta charset> に関して質問されていますが、これももともと  Content-Type: text/html; charset=Shift_JIS という HTTP ヘッダの代わりに、HTML 文書の方に  <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> と書いても良い、という HTML 4.0 規定がもとになっています。ところが、これを  <meta http-equiv=Content-Type content=text/html; charset=Shift_JIS> のように誤って引用符を消してしまう制作者・ツールがあり、このためブラウザは昔から、あたかも「charset 属性」なるものがあるかのように処理してきたのです。ならば、いっそのことこの「charset 属性」を標準化してしまおう、というのが HTML5 の  <meta charset=Shift_JIS> につながります。 要するに、この書式はもともと「記述ミスの救済措置」だったのです。HTML5 規定には「短いからもうこっちを使っちゃいなよ」と書かれていますが、当然ながらもともとの「正式な」記述も受け付けます。なぜ、もともと正しく書かれていたものを「記述ミスの救済措置」に合わせて修正する必要がありますか。 HTML5 の主眼は、過去に制作された Web ページの活用にあります。それは古い規格もそうですし、HTML として間違いだらけのものも、WWW ができて十数年に蓄積されたもの全てを、です。その方向性・方法論の善し悪しを論じることはしませんが、少なくとも、HTML5 規格が「古いページもそのまま残せるよう」に知恵を絞っているのに、いちいち古いページを直すのは、HTML5 の方針そのものを否定しているのではないですか。カタチだけ HTML5 になっても、虚しいだけでしょう。 作家さんであれば、むしろ要素タイプの意味論、例えば HTML5 における「段落」とは何か(これは HTML5 規定で定義されています)、見出しと結び付いて文章のアウトラインを構築する section 要素、場面転換の hr 要素、語句に様々なニュアンスを添えるフレーズ要素などをきちんと使うことの方が先決ではないでしょうか。ひとりよがりのマークアップでは「伝える」ことが難しくなります。

noname#226929
質問者

お礼

ありがとうございます。…すみません、勘違いしておりました。「推奨されていないけれど非推奨というほどでもない」という認識で宜しいのでしょうか。 HTML5のタグの本を買って勉強しておりますが、ブラウザが対応していないことなどから「現時点でタグを取り入れるのはまだ早い」と思い、余裕があるときに移行準備を進めていたところです。 確かに文字コードの変更によりファイルのサイズは大きくなりましたけれど、JISでは表示されなかった部分も表示されるようになりましたし。 外部CSSをUTF-8にしてあります。 それと先月から勉強し始めた ひよっこの私にもう少し分かりやすく説明してくだされば幸いでした(前回)。

回答No.1

こんなこと言ったら、怒られてしまうかもしれませんが、小説を公開するなら、PDFがいいのではないかと。

noname#226929
質問者

お礼

ありがとうございます。 ケータイからも閲覧できるようWebで公開しているため、PDFでは困るんです。

関連するQ&A

  • HTMLの文字コードについて

    ウェブサイトの文字コードは何を使うのが、よいのでしょうか?現在の自分のサイトはShift_jisですが、最近のサイトはUTF-8が多いようです。Shift_jis のHTMLをUTF-8に変更する場合、HTMLにどういった変更が必要なのでしょうか?また、UTF-8に変更するメリットはなんでしょうか?

    • ベストアンサー
    • HTML
  • 文字コードに関して

    自分は、今までHTMLとPHPを利用してサイトの構築をしてきました。 shift-jisでしか記述した事が有りませんが、文字化けの問題もなく今までやってこれました。 今回は、mySQLを利用してサイト(PC及び携帯)の構築を試みております。 その際に不安な点が幾つか有ります。 HTMLとPHPは今後もshift-jisで問題ないのでしょうか? その際、mySQLの文字コードもshift-jisにした方が良いのでしょうか? 下記の関係での推奨文字コードをアドバイス願います。 皆さんが開発者だったら、コレで書くのがベストと思えるパターンと理由も教えていただければ参考にさせていただきますので宜しくお願いします。 mySQL > PHP > HTML

    • 締切済み
    • PHP
  • HTMLの文字コードに関する素朴な疑問です!?

    HTMLの文字コードに関する素朴な疑問です!? HTMLファイルの書き方は、時とともに変遷してきました。 ■CSSの場合は、 <style type="text/css> ~</style> ↓ <style> ~</style> ■JavaScriptの場合は、 <script type="text/javascript> ~</script> ↓ <script> ~</script> ■文字コードの場合は、 <meta http-equiv="content-type" content="text/html; charset=UTF-8"> ↓ <meta charset="UTF-8"> 調べてみたところ、 ・日本では、「 UTF-8 」、「 Shift_JIS 」、「 EUC-JP 」の  3つがよく使われている文字コードである。 ・Shift-JISでの日本語1文字あたりのデータ量は2バイトだが、  UTF-8は1文字あたり3バイト必要である。  UTF-8よりもShift-JISの方が消費データが少なくて済む。 それにつけても、文字コードは何故 ・一本化しないのだろうか? ・一本化したら困ることでもあるのだろうか?

    • ベストアンサー
    • HTML
  • PHPのコードをUTF-8に変換したい。

    なんとかメールフォーム設置までこぎ着けたのですが、届いたメールが文字化けしてしまいます。HTMLの文字コードがUTF-8、PHPの文字コードがshift-jisなので原因はそこだと考えたのですがPHP内のshift-jis表記をUTF-8に変えるとPHP内で文字化けが起こってしまいます。 MultiTextConverterなどのアプリケーションを使っても同様の文字化けが起こります。 どうすればいいのか分かりません。 よろしくお願いします。

    • 締切済み
    • PHP
  • 各キャリアの文字コード

    プログラマー初心者です。 サイトの開発を計画中なのですが、 PC(OS)、スマホ、携帯すべてのブラウザに対応している文字コードはなんでしょうか? 調べてみると携帯3社は"UTF-8","Shift-JIS"などバラバラに書かれていたので。 (UTF-8が使えないauのみmb_convert_encodingを使い、文字エンコードを変換?) PC・スマホも(データベースも)含め全て統一したいのでやはりUTF-8が適切でしょうか? HTML5で<meta charset="UTF-8">とだけ指定しています。 またサーバからメール送信などを行う際はShift-JISで全て文字化けしないでしょうか?

  • Webサイトの文字コードについて

    日本のWebサイトの文字コードはShift-JISが多いようですが、UTF-8との違いってなんなんでしょうか?表示できない文字があるんでしょうか? また、MovableTypeのテンプレートはデフォルトでUTF-8になっていますが、Shift-JISに変更すると何か不具合があるんでしょうか? 投稿するカテゴリが間違っていたらごめんなさい。

    • ベストアンサー
    • HTML
  • 文字コードがUTF-8のサイトにshift_jisの入力フォームを組み込んだのですが、、

    教えて下さい。 同じような質問があったのですが、解決しなかったのでお聞きしたいのですが、現在、文字コードがUTF-8のサイトに、配布されていたcgiを使い、入力フォームを作っているのですが、こちらは文字コードが shift_jisになっています。なので、そのページだけshift_jisでもいいかなと思い、本体に使っているcssをそのまま使おうとしたところ、CSSの文字コードがUTF-8になっており、多少フォントの指定が入っていまして、これを読み込むとIEでおかしなことになってしまいました。こういった場合やはりフォントの指定をはずした方がよいのでしょうか? 後、CSSでUTF-8でフォントファミリーの指定をしていた場合、HTMLファイルの方がshift_jisになっているとやはりフォントはでないのでしょうか? 分かりずらいですが、宜しくお願いします。

  • HTML文字コード

    こんにちは。 文字コードのお話です。 PHPでテンプレートを呼び出して表示するのですが、UTF-8で指定しているのに、Shift-Jisで出力されている様子です。 HTMLのmetaタグで宣言しているのに、HTMLファイルだけがS-JISです。 <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> PHP側ではUTF-8を指定していて、そのページではきれいに表示されている文字と、文字化けしている文字がごちゃごちゃです。 htaccessの設定という可能性もあるでしょうか? HTMLに関連する問題だと思うのですが、ご存じの方いらっしゃいましたらご教授お願いします。。

    • 締切済み
    • PHP
  • 2つの文字コードの文字化けについて

    こんばんわ。 Linux使ってます。 わかりにくいかも知れませんが・・・ とあるHP更新ソフトを使ってるのですが、 そのHP更新ソフトが2つあり、 一つはShift_JISで自動でソースが書き出されます。 もう一つのソフトは自動でutf-8で書き出されます。 この時、バーチャルホストなので、 Apacheの設定は、noneにしてるので、 それぞれソフトで吐かれる文字コードに依存するようにしてます。 ですが、どうも、 cgiを使ってる所が文字化けしてしまいます。 utfで指定しないとダメなのかな・・・? 何か文字化けせず、 正常に表示させる方法はありますか? .htaccessなど使用も可能です。

  • 機種依存文字の文字コード変換

    現在、Shift-JISでCGIを作成しています。言語はPerlです。HTMLファイルから送信された文字をDBに登録するのですが、CGIをShift-JISで作成しているのに、DBがEUCとなっているため、jcode.plを利用して文字コードを変換しています。 しかし、文字が機種依存文字である場合、jcode.plでは文字コード変換ができないようで文字化けを起こした文字をDBに登録しようとしてエラーを起こしてしまいます。 何とか機種依存文字をコード変換したいのですが、可能でしょうか?

    • ベストアンサー
    • Perl

専門家に質問してみよう