• ベストアンサー

XMLのタグ名の禁則文字

こんにちは。 XMLのタグ名称に日本語を使用することができますよね。 ただし、先頭文字として「数値」や「記号(ある記号は除く)」など、いくつか制限がありますよね!? あとは、そもそも使用禁止のもの(半角カナ??)もあったと思うのですが,全然思い出せないので質問させていただきました。 知りたいのは、以下の通りです。 ・使用禁止文字 ・先頭文字として使用禁止文字 ・第2文字以降で使用可能文字 まぁ、ようするに全部となってしまうのかな!? 以上、宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • briony
  • ベストアンサー率29% (323/1090)
回答No.1

使える文字:  半角英数*(下記注)漢字 ひらがな カタカナ アンダースコア :(コロン)** *半角数字は先頭で使えない ** :(コロン)は名前空間で記述されるため、避ける 使えないもの:  半角カタカナ  全角英数字  <xml は予約語で利用不可(XML xMl など大小文字のいかなる組み合わせも同じ) 2文字目以降は、エクステンダー(文字間に使用されるーなど)、結合文字(アクセント記号)、ピリオド(.)、ハイフン(-) <> &など(実際には半角)は、表記したい場合は実体参照を利用(&lt; &gt; &amp; など )

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • briony
  • ベストアンサー率29% (323/1090)
回答No.3

アンダースコアとはアンダーバーのことです。 XMLについては、書く人によって呼び名がかわったりするので、 http://www.scollabo.com/banban/senior/xml/xm_03.html を見てみました。 最初の文字に使えるのは、アンダースコアと文字(BaseとIdeograph Caracter)のようです。 Combining Characterも利用できると思いますが、日本語環境には持ってきたくない感じがします。 なお、先ほどの情報は、私がXMLマスターを受験した際の、テキストに記載されているものですが、上記のサイトをそのまま解釈すると、全角英数もタグとして動作すると思います。 しかし、やはり英数は半角で統一した方が、あとあと問題が少ないと思います(エディターが置換などするとき、全角半角を同時に置換されたり、などを避ける意味で)。 1冊、リファレンスブックが手元にあると、便利ですよ。

参考URL:
http://www.scollabo.com/banban/senior/xml/xm_03.html
mkim
質問者

お礼

結局、全部聞いてしまってすみませんでした。 大変、助かりました。 ありがとうございました。 そうですね。昔、勉強したんですが忘れてしまったり 本も古くなっていますので、ちょっと購入を考えたい なぁと思いました。 ほんとうにありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。
  • briony
  • ベストアンサー率29% (323/1090)
回答No.2

部分欠けました 2文字目以降は、エクステンダー(文字間に使用されるーなど)、結合文字(アクセント記号)、ピリオド(.)、ハイフン(-) も利用可能です。

mkim
質問者

補足

ご解答ありがとうございます。 更なる質問となってしまいますが 1文字目で使用できる記号は、「_」(アンダーバー)と あと2つ程(計3つほど)あったかのように思うのですが、残りの記号もご存知であれば、ご教示ください。 その他については、大変参考になりました。 記憶もよみがえりました。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • XMLのタグ名に予約語は禁止?

    こんばんは、こんにちは。。 XMLのタグに関してです。 「XMLのタグ名には予約語が禁止です。」 と色々なところに書かれていました。 しかし、テキストファイルで <xml>aaa</xml>(xmlは予約語) と書いてIE6で見ると特に問題なく エラーになりません。なぜでしょうか? また、どこにそのような仕様が書かれているのか ご存知ありませんか? ・例えばその旨について、  以下のところに書かれていました。 1.同カテゴリの質問で。 「XMLのタグ名の禁則文字 」 2.以下のURL http://noribeat.s38.xrea.com/xml/xml20020315.html 他には参考書など。。 ※YAHOO!で「xml タグ 予約語 禁止」と検索すると  上の二つが検索できました。 ご回答よろしくお願いいたします。 以上

    • ベストアンサー
    • XML
  • “半角カタカナ”は、ずいぶん昔から使われている1バイト文字なのに、なぜ文字化けするのか?

    よく、「HPやメールなどでは、半角カナは使わない方がいい。」と言いますが、 これはなぜでしょうか? 半角カナは、見にくいくらいで、 文字自体は、普通の英数字の1バイト文字と、変わらないと思います。 普通の半角(1バイトの)英数字は文字化けせずに表示できて、 なぜ半角カナだけ、同じ1バイト文字であるに関わらず、文字化けしてしまうと言われているんでしょうか? (そもそも、本当に半角カナを使用すると、文字化けする例があるのかすら、謎です。) パソコンをよくご存じの方、またはわかる方、教えてください!

  • Excel 条件付き書式:条件を半角文字にしたい

    条件付き書式でセルに色を付けたいのですが、 条件は、「半角文字を使用している事」です。 対象となる半角文字は、”英数カナ記号”です。 どのようにすればよいのでしょうか?

  • XMLタグ情報取得

    PHPにxmlファイルのタグ情報を利用するシステムを構築したいのですが、調べてもよく解らなかったため質問させて頂きます。 PHPは勉強経験があるため解るのですがXMLはまったくの初心者です。 システムは以下の流れです。 システムA(PHP) <?php  $i;  if($iがシステムBで使用されているか確認){   使用されている場合$iで処理  }else{   使用されていない場合xmlファイルからタグ情報取得   for($iの親タグ<B>を取得){    if(<$i><$j><$k>のどれかがシステムBで使用されていないか?){     $jが使用されていた場合、システムAの$iと、システムBの$jは同じ使用用途のデータと判断し処理    }   }  } xmlファイル <?xml version="1.0" encoding="EUC-JP"?> <A> <B> <$i></$i><$j></$j><$k></$k> </B> </A> このようなシステムを構築したいのでご教授お願いします。 違うシステム同士でデータを利用する際、同じ使用用途でもシステムによって名称が異なる場合にも対応できるシステムを課題としています。 また、DOM方式を利用した方法だと助かります。 環境はXP、PHP5、Apache2.0です

    • ベストアンサー
    • PHP
  • 全角、半角文字の判別について

    フォームのテキストで全角なら10文字まで、半角なら20文字まで入力できるようにしたいのですが、EUCの場合、半角カナは2バイトになるため、バイト数で制限をかけるとうまくいきません。かといって文字数で制限をかけてもうまくいきません。 何かいい方法はあるでしょうか?

    • ベストアンサー
    • PHP
  • 文字変換について

    PHP+MYSQLで会員制のサイトを作っています。 文字の扱いについて教えてください。 掲示板等で、入力された文字列の処理についてですが、 入力禁止文字や、半角カナ、全角英文字等の定番的な処理方法はあるのでしょうか? (半角カナは全角に変換すべきとか、) この関数を使うといいよ、とかいうのがあると嬉しいです。 なお、文字コードはeuc-jpです。

    • 締切済み
    • PHP
  • 1文字ごとに<br>タグを挿入するルーチンを見てください。

    文字列があって、1文字1文字の後ろに<br>タグを挿入して、たてに表示させたいと思います。 一応このようなサブルーチンを考えました。 sub insertChar{ local $string = $_[0]; local $char = $_[1]; local $new = ''; local @chars = (); local $temp = ''; while($string =~ s/^.//){ ###全角の1バイトめがtempに入っていたら。2バイトめと一緒に配列に入れる。 if ($temp) {$temp .= "$&"; push (@chars, $temp); $temp = '';next;} ###tempが空のばあい、半角文字じゃないかどうかをチェック。半角文字で無ければtemp変数に取っておく。 if ($& =~ /[^a-zA-Z0-9_?,.!@\\\/\~\*\&\^\%\$\#\-\+\s\(\)\[\]\"\'\{\}\<\>\:\;\`\|]/) {$temp = "$&"; next;} ###tempが空で、全角の1バイトめでもなかったら半角文字ということで、素直に配列に入れる。 push (@chars, "$&"); } $new = join ("$char", @chars);return $new; } これを $hoge = &insertChar("$hoge",'<br>'); 見たいな感じで使っています。実際期待通りに動いてはいるんですが、なんかきっともっとスマートなやり方があると思うんです。 とくに、半角文字を判断させるところはとにかく思い付く限りの半角もじをリストアップさせているだけで、しかも、どれをエスケープすべきかわからないので全部エスケープさせてしまいました。 一応どういうロジックで処理しているか説明しますと、受け取った文字列を1バイトづつ判断し、それが半角英数記号文字だったら@chars配列へ格納し、半角英数記号文字以外は2バイト文字の1バイトと目判断して$tempに格納、次の2バイトめと一緒にして、@charに格納。最後にjoinです。 なんか、もっと優雅な方法ってないものでしょうか? よろしくお願いします。

    • ベストアンサー
    • Perl
  • au→Willcomで文字化け

    au携帯(EZWEBドメイン)へ届いたメールを、 Willcom(PDXドメイン)へ転送しています。 文字化けが激しいのですが、なにか対処方法はありませんでしょうか? 主に、半角カナと半角記号(「」など)が文字化けしているようです。

  • ファイル名に使用できる文字について

    使用するOSやアプリケーションによっては、ファイル名に使用する文字というのは制限があると聞いた事があるのですが、どういった文字が使用しないほうがいいのでしょうか? 特に知りたいのは、半角スペースを多用しているので使用しない方がいいのかどうかが知りたいです。?半角スペースより半角アンダーバーの方がいいのでしょうか? 今はwindows2000を使用していますが、マック等の他のOSやアプリケーションを使用する事になった時にファイル名をいちいち変えなければならなくなると大変なので教えて戴きたいと思い質問させていただきました。 具体的にどんなアプリケーションやOSでどんな文字が使用出来ないのかを教えて戴けると幸いです。

  • コピー禁止のタグを教えて下さい

    現在、楽天でブログを開設しています。 コピー禁止に設定する為、タグを入れてみたのですが、 楽天ブログでは、BODYタグが使えないらしくコピー禁止設定が出来ませんでした。 そこでお聞きしたいのですが、BODYを使用しないタグ 又は、楽天ブログでコピー禁止用に使えるタグってありますか? 出来ましたら文字が入るタイプが希望ですが 文字が入らないタイプでも構いません 宜しくお願い致します

このQ&Aのポイント
  • 売り手側の電子帳票保存法についての対応について理解していますか?売り手側は会計処理の注文書や納品書、領収書を電子保存しなければなりません。
  • 売り手側が提供する書類(見積、請求、納品、領収)の控えや、お客さまから受領した書類(注文書、受領書、検収明細書、支払明細書)も保存が必要です。紙やメールなどお客様の環境によって形式が異なります。
  • 売り手側が使用している販売管理システム(弥生販売)を活用することで対応が容易になります。詳細な情報は公式ウェブサイトを参照してください。
回答を見る