• ベストアンサー

半角文字はどれまでが特殊文字ですか?

こんにちは。 英語サイトを作成しようとしているのですが、 半角文字はどれまでが特殊文字だか分かりません。 下記のサイトを参考にしようとしましたが、アルファベットまで特殊文字に含まれています。 http://web-dou.com/html/t023b.html <や、>などはもちろん認識しているのですが他のが分かりません。 どなたか、御教示願えないでしょうか? 以上、よろしくお願い申し上げます。

  • HTML
  • 回答数4
  • ありがとう数4

質問者が選んだベストアンサー

  • ベストアンサー
  • think49
  • ベストアンサー率59% (285/482)
回答No.4

#1 です。 HTML上で文字として表示したい場合は <>& をHTMLエンティティ化する必要があり、属性値として指定するなら <>&"' をHTMLエンティティ化する必要があります。 そして、指定した文字コード外の文字を表示したい場合にHTML文字実体参照、HTML文字数値参照が使われます。 UTF-8 文字コードを指定した場合は ISO/IEC 10646(UCS) で規定されている文字は全て使用できるということです。 あなたが指定する文字コードの文字セットを調べ、そこにない文字だけHTML文字実体参照/数値参照を指定してください。 一般に英語圏ならASCII文字を使用しているため、U+00000~U+000FFまでは使用できるはずです。 他の文字については私は知らない為、その時々で調べるか文字参照を使いますね。 &copy; は何となく文字参照を使いたくなりますが…。 # Re: shoshin01さん

shoshin01
質問者

お礼

再度のご回答ありがとうございます。 丁寧なお言葉でありがとうございます。前が見えてきました。 ありがとうございました。

その他の回答 (3)

回答No.3

・引用されている表で「数字での表現」の部分で、128 以上の数字が使ってある文字は、「特殊文字」 ・それ以外の文字で、「名前での表現」のところに記述がある文字は、「特殊文字」 それ以外は通常の文字と考えれば、安全かと思います。 「数字での表現」の数字が何を表しているかですが、これは、「ISO 10646(いわゆるユニコード)」の文字コードで指定することになっています。 で、この文字コードは、「数字での表現」の、20 - 127 の範囲では、ASCII (いわゆる半角英数字)と、160 - 255 の範囲では ISO/IEC 8859-1 という文字コードと、重なっています。 (※さらに、20 - 127 の範囲は、ASCII とも重なっています) こういうことで、 ・「数字による表現」で、20 - 127 の範囲は、普通の英文字として表現可能 (ただし、「名前での表現」が定められている部分は、HTML の記号と干渉したりするので、「名前で表現」したほうが安全) ・160 - 255 の範囲は、UTF-8(ユニコードの表現形式の一種)や、ISO/IEC 8859-1 という文字コードで書いているのなら、直接入力してもOK. (ただし、ASCII の半の文字ほどには、一般的に読めるかどうかは?なので、数字で表現した方が安全) という感じになります。

shoshin01
質問者

お礼

ご回答ありがとうございます。 少し難しいので理解するのが時間かかりそうです。 ありがとうございました。

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.2

HTMLに特殊文字という規定はありません。 【引用】____________ここから 5.4 表示できない文字   文書中の全ての文字を有意に レンダリングすることができないユーザエージェント  もあり得る。 例えば、適切なフォントが得られない場合や、ユーザエージェントの内  部コードでは表現できない値を持つ文字に出くわした場合などがこれに当たる。   ・・・【中略】・・・  ・欠落した文字を数値で表現する場合は、十進ではなく、十六進形式で示す。文字集   合の規格で十六進形式が使われるからである。  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ここまで[HTML Document Representation (ja)( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/charset.html#h-5.4 )]より 【引用】____________ここから 5.3 文字参照   ある所与の文字符号化方法が、文書文字集合の全ての文字を表現できるとは限らない。  こうした符号化を利用する際や、文書中の文字について直接入力できないよう設定され  ているハードウエアやソフトウエアを使っている場合、著者はSGML文字参照を用いてよ  い。 文字参照とは、文字符号化方法に依存せずに文書文字集合の全ての文字を示す手法  である。   HTMLの文字参照には、次の2つの形式がある。   ・ 十進または十六進どちらかでの数値文字参照。   ・ 文字実体参照。  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ここまで[HTML Document Representation (ja)( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/charset.html#h-5.3 )]より ★すべての文字は数値文字参照で示せます。 ★ごく一部は、利用しやすい文字実体参照が利用できます。  ⇒HTML 4の文字実体参照( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/sgml/entities.html )  ⇒HTML4 で使える文字実体参照( http://www.ne.jp/asahi/minazuki/bakera/html/reference/charref ) ただ、 【引用】____________ここから 5.3.2 文字実体参照  著者がより直感的に文字の参照を行えるよう、HTMLでは文字実体参照を使えるようになっている。  ・・・【中略】・・・  特定の文字をエスケープするために頻繁に用いる4つの文字実体参照を、ここに特記しておく。  ・「&lt;」は < 記号を表現する。  ・「&gt;」は > 記号を表現する。  ・「&amp;」は & 記号を表現する。  ・「&quot;」は " 記号を表現する。  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ここまで[HTML Document Representation (ja)( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/charset.html#h-5.3.2 )]より  この4つについては、ブラウザがHTML上で使用するSGML符号として解釈してしまう危険を避けるために文字実体参照または数値文字参照を使わなければならないもじです。 >英語サイトを作成しようとしているのですが、  相手の使用しているコンピューターがその文字のフォントを持っているか否かに依存します。  すべてのコンピューターで可能な文字は、  ⇒ASCII Punctuation( http://www.unicode.org/charts/PDF/U0000.pdf )  ですので、文字実体参照が定められている文字を「特殊文字」としても、そのフォントを持っていなければ表示することはできません。ギリシャ文字などは日本語のシステムでは全角で表示されますが、アメリカのシステムでは半角だったりします。

shoshin01
質問者

お礼

大変長文のご回答、ありがとうございます。 噛み砕いてみようと思います。

  • think49
  • ベストアンサー率59% (285/482)
回答No.1

特殊文字の定義がわかりませんが、数値参照も含めると HTML 5 では全ての文字を参照できます。 http://www.whatwg.org/specs/web-apps/current-work/multipage/named-character-references.html#named-character-references <>&"' はHTML文字実体参照にするとして、他は該当文字コードで指定できない文字をHTML文字実体参照を指定すればいいのではないでしょうか。 # UTF-8 なら ISO/IEC 10646(UCS) 準拠のようです。 # http://std.dkuug.dk/jtc1/sc2/wg2/ # Re: shoshin01さん

shoshin01
質問者

お礼

think49さん、ご回答ありがとうございます。 私が言いたい特殊文字とは、ブラウザで開いたときにHTMLソースファイル内に”書いた文字をそのまま表示するものではない”という意味です。 ↓ソースファイル <p>1234567890 abc</p> ↓ブラウザの表示 1234567890 abc 説明が下手で申し訳ないのですが、上記のようにならない文字のことを特殊文字と意味します。 # UTF-8 なら ISO/IEC 10646(UCS) 準拠のようです。 上記の点が分かりませんので再度お返事いただけないでしょうか。

関連するQ&A

  • メールアドレスに「半角大文字」は使えるのでしょうか?

    ホームページ作成の勉強をしておりますが、テキストの中に仮のアドレスとして(ABC12345@*****.com)と書かれた部分がありました。 実際のアドレスとして「ABC」などの半角大文字が、使われることがあるのでしょうか? 私の今までの認識では、決まりごととして(半角小文字&数字)と思っていたのですが・・・

  • 英文をすべて英数半角文字にする方法

    英文(かなりの長文)をエクセルで作成し web. 上に貼り付けようとしたところ、その欄は、英数半角文字のみ受付けるようになっており、どうしても入力できません。 アルファベット、数字、記号など文中の怪しいところを、英数半角文字で再度打ち直して何度も試しているのですが、どうしても受付けてくれません。 どの文字が全角なのか検索してくれ方法、あるいは全角文字を自動的に半角に直す方法等、ありましたら、どなたか御教授いただければ幸いです。

  • HTMLの記述は半角大文字でもいいのでしょうか?

    ホームページ作成言語のHTMLを記述する際、アルファベットが半角であれば、大文字でも小文字でも結果は変わらないようです。 大文字小文字どちらを使ってもよろしいのでしょうか? 何らかの法則みたいなものがあるのでしょうか?

  • 半角文字と全角文字の対応表について

    半角文字と全角文字の対応表を作成したのですが、疑問に思った文字が3個あります。 作成方法はVbaで StrConv関数 を使用しました。 (1)半角"\"から全角"¥"を取得できない。 逆も同じです。 (2)半角"'"(0x27) <--> 全角"'"(0xFA56)シフトJIS 半角"""(0x22) <--> 全角"""(0xFA57)シフトJIS となりました (3) 上記(2)について調べてみたら  シフトJIS(JIS)でみると  ED40(7921) から EEFC(7C7E)までと  FA40(9321) から FC4B(972C)までが   どう見ても同じ文字が登録されているように思われます。  10年以上前のN88-BASIC(86)ガイドでは 上記(ED40以降)の範囲を  拡張文字として扱っていますが、IME2000の辞書では  下記(FA40以降)を 漢字3 として扱っているのと同時に、 ED40からを 漢字2 の最後に含まれています。  これらはどういうことなのでしょうか。 どなたか教えてください

  • 文書作成における全角・半角について

    文書を作成する際は、 ひらがな、漢字、カタカナは全角 アルファベット、数値は半角 としていますが。 第1条 の 「1」もやはり半角にするのが常識でしょうか? あと、(1) の ( ) 括弧は、全角 or 半角 のどちらにするのが常識でしょうか。 ご教示よろしくお願いいたします。

  • 文字列中の半角カタカナ文字だけを半角スペースに置換

    文字列中の半角カタカナ文字だけを半角スペースに置換し、 「それ以外の文字列」だけをそのまま残して整形したいのです。 EXCELのVBAで処理できますか ? (Sheet1に文字列がある状態でSheet2に完成形を作成する) 「それ以外の文字列」とは、半角の英語(A,a,B,b)や半角数字で 全角や日本語漢字などはありません。 カタカナ文字の数が多いのでどのようにカタカナ文字の候補を 定義すれば上手く処理できるかイメージ出来ません。 以下に実際に近い例文及び完成形(整形後)のイメージです。 完成形は、イメージなので間違っているところがあると思われます。 整形前 Sheet1 ----------------------------------------------------------------- ワロイイアアー ー ー ーアアイイロワ ロイ゚ ゚゚ ワワイイイイワワ アー p r e s e n t s ーア ワワイイイイワワ ゚゚ ゚イロ ゚ワ ワロ゚゚゚ ゚゚ロイアー゚ ゚ーアイロ゚゚ ゚゚゚ロワ ワ゚  ゚ ゚゚ ゚゚ ゚  [ Turget 1 ] [ URL : http://www.gdbps.com.jp ] [ Doom : Windows ] ワロイアー   ーアイロワ ワロイイアアー ー : T A R G E T : ー ーアアイイロワ ロイ゚ ゚゚ ワワイイイイワワ アー ーア ワワイイイイワワ ゚゚ ゚イロ ゚ワ ワロ゚゚゚ ゚゚ロイアー゚ : LINE OF SETING : ゚ーアイロ゚゚ ゚゚゚ロワ ワ゚  ゚ ゚゚ ゚゚ ゚  ワワ ゚ワ ワ゚ ワワ ワロイイイイロロワ ワアー ーアワ ワロロイイイイロワ 整形後 sheet2 -------------------------------------------------------------- p r e s e n t s [ Turget 1 ] [ URL : http://www.gdbps.com.jp ] [ Doom : Windows ] : T A R G E T : : LINE OF SETING : ------------------------------------------------------------------

  • 半角ハイフンを半角スペースで囲むとハイフンが変化

    ブログ(WordPress)をしています。 題名に「文字文字 - 文字文字」と記入したところ、半角ハイフンが変化してしまいます。 ソースを見ると、ハイフンの部分に–と記入されています。 半角スペースで半角ハイフンを囲むと、半角ハイフンが変化してしまうのでしょうか? (ちなみに、半角ハイフンの前後に半角スペースをとらずに記入したところ、ソースには普通に - と表記されていました) http://www.youtube.com/watch?v=kXYiU_JCYtU 上記サイトの動画の題名部分Linkin Park - Numbのように表示させたいのですが、この題名の「 - 」の部分は、半角スペースで囲った半角ハイフンですよね? Web上で半角スペースで囲った半角ハイフンを記入するには、どのようにすればよいのでしょうか。 ご存知でしたら教えてください。 よろしくお願いします。

    • ベストアンサー
    • HTML
  • 文字の表示がおかしくなりました!

    いつも使っています、ノートパソコンですが、ローマ字打ちで、半角文字で打つようになっていましたが、かなの「あ般」状態で、SHIFTキーを押しながら、アルファベットの大文字を打つ時確か半角だったように思うのですが、全角文字になってしまいます。(英語の大文字と小文字を混ぜて打つとき、全角と半角が混ざってしまうような、小文字はSHIFTから指をはなすので) 私の勘違いではなければ、どすれば直るか教えて下さい。

  • CString型 全角半角を意識せずに「1文字」ずつ取り出す

    CString型の文字列に格納されている文字を1文字ずつ取り出したいです。 ただし半角なら1バイト単位で、全角なら2バイト単位で、という風に分離したいです。 半角だけなら、str[0] str[1]...という風に取り出せますが、 全角が混じっていると、1バイト目、2バイト目と分離されてしまいます。 その文字が半角か全角かを判断して、半角なら1バイト、全角なら2バイト同時に取り出すロジックを、下記のような感じの関数として作りたいです。 CString ripString(CString str,int index){ //ソースとなる文字列、n文字目 /*~処理~*/ return 文字列; } たとえば"あaいbうcえdおe"という文字列を入れると、 CString str="あaいbうcえdおe"; ripString(str,0) →結果 "あ" ripString(str,1) →結果 "a" ripString(str,2) →結果 "い" ripString(str,3) →結果 "b"  ・  ・  ・   こういうことをするのに良い方法はありますか? 1バイトごとのそれぞれの文字自身が、 ・半角文字なのか ・全角文字の前1バイトなのか ・全角文字の後1バイトなのか これをプログラム的に判別する方法があればいいのですが・・・悩んでいます。

  • Wordの日本語全角文字・半角カタカタ文字の見つけ方

    海外向けの文書を作成中で、日本語から英語に翻訳しているのですが、頁数が多いため、分担して翻訳してます。 ところが、もとのワードファイルに上書きしているため、 2バイトの文字(日本語全角文字・半角カタカタ文字)が混在しているようです。英語圏ですと2バイトは見れませんので、1バイトにしなければなりません。 見た目は、英文ですので、見つけるのに時間がかかります。 何か簡単に見つける方法はないでしょうか?

専門家に質問してみよう