• ベストアンサー

謎の文字記号 これどうなってんの?

※OSや文字コードとかで正しく表示されていないかも知れません ツイッターで見つけたのですが・・・ 検索しても出てこないので回答お願いします。 「ด้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้」←この文字はどうなってるのですか? 文字数カウントすると52でした。 これに似たような謎の技術文字の名前とか呼ばれ方があれば教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • okgoripon
  • ベストアンサー率44% (1141/2550)
回答No.1

 多分、タイ語の文字ですね。  「結合文字」と呼ばれるもので、複数の文字(のコード)の字型を組み合わせて1文字として表示しています。なので「ด้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้」を表す単一の文字コードというのは存在しません。  例えば「イ」と「ム」を組み合わせて「仏」にするような感じですね。この例の場合は日本語の文字コードなので、「イム」と書いた場合、見た目も文字コードも2文字分ですが、タイ語の場合は文字コード上は「イ」と「ム」の2文字でありながら画面上では「仏」の1文字として表示されている、という感じになります。 参考:Windowsコードページ・タイ語 http://msdn.microsoft.com/ja-jp/goglobal/cc305142.aspx

GuestAccount
質問者

お礼

ご回答ありがとうございます。 なるほど・・・結合文字と呼ばれるのですね。 これに似た文字の謎も解けました

その他の回答 (3)

  • pem42391
  • ベストアンサー率52% (70/134)
回答No.4

 タイ語をタイ文字で表現するには、子音字、母音字、声調記号、その他の記号、を組み合わせて表現します。  どういうことかというと、子音字とは日本語をローマ字書きするときの「P」とか「M」のようなもの。母音字とは日本語をローマ字書きするときの「A」とか「I」のようなもの。これを組み合わせて「P」「A」で「ぱ」になったり、「M」「A」で「ま」になったり、「P」「I」で「ぴ」になったりするわけですね。  声調記号とは、その名のとおり声調を決める記号。では声調とは? 日本語はあまり声調にこだわらない言語なのでピンとこないかもしれないけれど、「にじ」という言葉は声調によって「二時」や「虹」という異なった意味の単語になります。日本語にはこのような声調によって意味が変わってくる単語はそれほど多くはないし、文字にするときは漢字を有効に使えばほとんど問題にならないのです。しかしタイ語は声調が非常に大事な言語であり、漢字のような表意文字ではなく、子音字や母音字を組み合わせて使うため、声調記号があると非常に便利なので必須の記号となりました。  最後に、その他の記号というのも時々使います。一つ挙げると、“この字は発音しませんよ”という記号もあるのです。文字には書くけれども発音はしない、という変なことがタイ語にはあります。説明すると長くなるのでやや近い日本語で乱暴に例えると、「和泉」と書いて「いずみ」と読みますね。「和」の発音はどこに行っちゃったんでしょうか? 我々は普通経験で「いずみ」と読みます。けれどタイ語は読み手の経験だけにまかせないで、音に出さない文字の上に律儀に記号を付けるのです。  ・・・と、長ったらしくタイ語のタイ文字による書き方の基礎を踏まえた上で、質問の文字を解説すると、すでに回答があったように > 「ด」「 ้」「 ็」の3文字  から成っています。最初の字「ด」は子音字で、ローマ字でいえば「D」とほぼ同じ発音になります。次の字「 ้」は声調記号の一つです。最後の「 ็」は“短く縮めて発音しなさい”(乱暴に日本語で例えると促音「っ」に近い)という記号です。  そしてこの3つを組み合わせて発音は・・・できません。メチャクチャな組み合わせだからです。正しいタイ語にはこのような組み合わせはありません。キーボードを適当に叩いたらこうなった、というだけでしょう。  正しい文字の組み合わせによるタイ語とは、たとえば・・・ 「ขาว」 この字は子音字「ข」(ローマ字なら「KH」)、母音字「า」(ローマ字なら「AA」)、子音字「ว」(ローマ字なら「W」)で「白」「白い」という意味のタイ語です。読みは「かーお」という感じ。    でも、まったく同じ子音字「ข」、母音字「า」、子音字「ว」を同じ順番で組み合わせても、そこにさらに声調記号「 ่ 」がちょっと付くだけで「ข่าว」で「ニュース」という別の意味の単語になり、その声調記号が別の声調記号「 ้ 」に入れ替わるだけで「ข้าว」となり「米」「ご飯」という、またまた別の意味の単語になります(子音字「ข」、母音字「า」、子音字「ว」と、その順番はまったく同じですし、読みは3つが声調こそ違うものの「かーお」で同じ)。まるでパズルのように思えるかもしれません。  質問者氏は以上のような言語学的な回答ではなく、PCのコード的な解説を希望していたのかもしれませんが、とりあえず。

GuestAccount
質問者

お礼

長文回答わざわざありがとう御座います。

  • okgoripon
  • ベストアンサー率44% (1141/2550)
回答No.3

 補足、というか認識不足だったので一応。  この文字、WindowsXPで見ると普通に1文字分なんですが、Windows7で見ると何か縦にすごく長い文字になるんですね(汗)。前回・前々回の回答をしていた時はXP機だったので気づかなかったのですが、Windows7機で見てびっくりでした。  多分「結合文字」の表示の仕組み上、Windows7だと馬鹿正直にどんどん上に積み重ねていくんだと思います。WindowsXPだとマトモっぽく見えるので、もしかしたらWindows7の潜在バグ(ただしタイ語文字的には存在しない組み合わせなので実害は無い)なのかもしれません。

GuestAccount
質問者

お礼

Twitterで見た時に縦に伸びてるのをみて質問したが やっぱりOSによっても表示の違いがあることがわかりました。 あと、お礼が遅くなってすいません 回答締切るの忘れてました

  • okgoripon
  • ベストアンサー率44% (1141/2550)
回答No.2

 ちょろっと解析してみました。  「ด้็」は「ด」「 ้」「 ็」の3文字の結合文字ですね。ただし、タイ語的に正しいものなのかどうかは、タイ語を知らないので判別付かないのですが。  そして、文字数が52になっている理由は、コード的に「 ้」「 ็」の2文字がたくさん重複しているからです。  私が例示している「ด้็」は、その重複分を削ってありますので、これの文字数をカウントすると、もっと少ない文字数になるんじゃないかと思います。

GuestAccount
質問者

お礼

詳しい説明ありがとうございます。 三文字からできていたのですね。 メモ帳にコピペ繰り返すと表示が変になってたりするのは結合文字だからなのですね

関連するQ&A

  • 謎の文字????????「環҈҇͢ 」

    twitterで謎の文字を見つけました。 環҈҇͢ この文字の正体は一体何ですか?コピペで普通にテキストとして入力できます。 twitterで検索すると出てきます。 →https://mobile.twitter.com/search?q=環҈҇͢ これは 「(アップルマーク)」 「ʕ•̫͡•ʕ•̫͡•ʔ•̫͡•ʔ•̫͡•ʕ•̫͡•ʔ•̫͡•ʕ•̫͡•ʕ•̫͡•ʔ•̫͡•ʔ•̫͡•ʕ•̫͡•ʔ•̫͡•ʔ」 のような隠し文字でしょうか?

  • ページ内の文字や記号の数え方

    IEブラウザで開いたページ内の、ある文字(指定したもの)の数え方を教えてください。 たとえば、今開いているこのページの中に、「あ」とか「●」などという文字や記号が何個あるか数えたい、ということなのです。 画像で描いてある文字や記号は含まずに、テキストデータの文字を対象にしたいと思います。 「このページの検索」を使って検索するごとにカウントすればいいのでしょうが、さささっと該当する文字の数が数えられると助かります。 そんな方法がもしあれば、ご存知の方、どうぞおしえてください。お願いします。

  • IE6で謎の文字列

    OSはWindowsXP、ブラウザはIE6.0を使っています。 Googleを開くと、普通のグーグルのロゴや検索バー以外に、ブラウザの画面左上に mBBBBBBB WtXsUsgBBBBt BBe| という謎の文字列が表示されます。1週間前にも同じ症状が出て、ウイルスか何かかな?と思いOSをクリーンインストールしたのですがまた発症してしまいました。この状態になると、グーグルの画像検索で出てきた検索結果を開こうとすると、先ほどの文字列が左上に表示されるだけで、ほかには何も表示されないようになります。またグーグルMAPでもこの文字列が表示され、マップもごちゃごちゃに表示されてしまいます。 この文字列はいったい何なのでしょうか?ご教授願います。

  • 【Word】文字カウントについて

    Wordには、「文字カウント」という機能がありますが、 これとは別に、作成ファイルを開いた際にも、画面 左下隅に文字数が表示されています。 この文字数は、「文字カウント」で表示される文字数 とはまったく合いません。 いったい、何を基準にカウントされているのか、 ご存知の方がいらっしゃいましたら、よろしくお願い いたします。

  • ここに、手のような記号が書かれています。

    ここに、手のような記号が書かれています。 http://twitter.com/ikko/status/5790611850 コピペしようにも、文字化けしてしまいますので、張り付けられませんが、この記号はキーボードではどう打てばいいのでしょう? また、機種依存文字なのでしょうか?(どのOSの?) ご回答、お願いいたします。

  • HP文字化けの謎?

    なぜ文字化けは、謎の中国語みたいになるのでしょうか? 普通に、日本で、検索していて、HPを見ている途中で。 素朴な疑問です。

  • 至急!!wordの文字カウントについて!!

    wordでレポートを書こうと思うのですが、空白の部分も文字数に含めなければならないという 規定があります。 ですが、その設定の仕方がわかりません。 文字数はカウントしてくれますが、空白の部分はカウントしてくれないので、空白の部分もきっと10文字は余裕でこしているはずなので実際今何文字なのかわかりません!! 検索してもなかなかでてこないし、教えてください!!

  • 入力文字数を教えてくれる、便利なソフトないですか?

    文字カウントを教えてくれるソフトってないでしょうか? 例えば、1000文字に設定すると、 文字入力時に、1001文字目になると文字の色が変わるとか、 ここまでが1000文字までですよ、とラインが引いてあったり、 (改行などすると、ラインも自動的に下がる) 小さなダイヤログでカウント表示がリアルタイムで表示されるとか。 そういったものないでしょうか? ワードにも文字カウントはあるのですが、入力中はカウントしてくれません。 いちいちカウントを実行して初めて文字数がわかるので、効率が悪くて。。。。。 どなたかお願いします

  • 2バイト文字の記号について

    ■、○、▼などはどの言語環境でも表示されるのでしょうか? デザイン要素として□を使いたいのです。 NC の文字コードセットを切り替えてみても 特に文字化けを起こしたりしないのですが、 それは私が日本語環境だからなのですか?

  • 文字の数え方

     use utf8; を宣言すると、内部に記述されるリテラルにutf8フラグが立てられて、例えばlengthを用いて文字数を数えた場合に、多バイト文字であっても1文字を1とカウントしてくれるそうです。 次のコードでは、文字列の文字数を数えてみました。。   #! /usr/bin/perl   use utf8;   use Encode;   my $str="最初にUTF-8で表示します。次にshift-JISで表示します。";   print length $str;   print "\n";   $str=encode("shiftjis",$str);   print length $str;   print "\n"; 実行結果は以下の通りです。   33   52 文字列がUTF-8の場合は、シングルバイト文字、多バイト文字関係なく1文字で計算するので33文字です。これに対してshift-JISの場合は、多バイト文字を2文字でカウントするので52文字になります。 なるほど。 しかし、次がよく分からないんですけど、   use utf8; をコメントではずすと、その実行結果は以下のようになりました。   71   76 これはどういう計算なのでしょうか?

    • ベストアンサー
    • Perl