• 締切済み

2バイト文字から元の1バイト文字を見つけたい(その逆も)

2バイト文字から元の1バイト文字を見つけることはできませんか? 文字コード表から、手作業で目的のコードを探してやれば、自力で変換することは出来ます。 が、しかしもっと効率よく一発変換なるものはないでしょうか?。 例えば「保狂鏡凝」こういう文字列があった場合。 保   狂   鏡   凝 4A5D  3638  3640  3645 ハ  ン  カ  ク カ  タ  カ  ナ 4A  5D  36  38 36  40  36  45 したがって「保狂鏡凝」は「ハンカクカタカナ」と解読することができるます。 それから、逆に半角文字の「ハンカクカタカナ」から「保狂鏡凝」と変換したいです。 どなたかこのような機能を持つフリーウェアご存知でしたら教えてください。 できればXPで動くものが理想です。

みんなの回答

  • mrumesuke
  • ベストアンサー率45% (254/557)
回答No.4

バイナリエディタ+IEで解決できそうです。 " 保狂鏡凝 [改行]"という内容のテキストファイルがあるとします。(参考URLによると『行の始まりは、ASCII で始まる。行の終わり(改行の直前)は、ASCII 文字で終わる。』という決まりがあるとのことなのでそれに従いました。) このファイルをバイナリエディタで開くと 20 1B 24 42 4A 5D 36 38 36 40 36 45 1B 28 42(または4A) 20 0D 0A   ~~~~~~~~~                ~~~~~~~~~~~~~~~~~~~ となっていると思います。 先頭の20が半角スペース、それに続く1B 24 42(JIS X 0208=第1水準漢字、第2水準漢字等開始のエスケープシーケンス)を1B 28 49(JISカナ=半角カナ開始のエスケープシーケンス)に変更して保存します。そのファイルをIEで開くと「 ハンカクカタカナ 」と半角で表示されるはずです。 IE6.0/Windows2000SP4で確認しました。 ちなみに1B 28 42はASCIIコード開始の、1B 28 4AはJISローマ字開始のエスケープシーケンスです。厳密に言うと、1B 28 4Aでは『行の終わり(改行の直前)は、ASCII 文字で終わる。』というルールに則っていないことになります。

参考URL:
http://www.mikeneko.ne.jp/~lab/kcode/encode.html
  • ranx
  • ベストアンサー率24% (357/1463)
回答No.3

4A5Dが「保」となるコードはJISですね。 コンピュータ上で直接使っている例は少ないと思いますが、 Eメールなどでは、それを組み込んだ形で使われています。 元来は2バイトコードと1バイトコードが別々に定義されて いるものなのですが、Eメールなどでは、「エスケープシーケンス」 と呼ばれるコードを挿入することで、エンコーディングを 切り替えられるようになっています。 ですので、そうしたツールであれば、適当なエスケープシーケンスを 挿入したり取り除いたりすることで、別のエンコーディングによる 表示に切り替えられるはずです。 具体的にどういうコードを入れるかは・・・ごめんなさい。 知りません。暇があったら探してみます。

  • mrumesuke
  • ベストアンサー率45% (254/557)
回答No.2

JISだったようですね。 Stirlingは残念ながらJISには対応していません。 よって#1は見当違いなアドバイスでした。スミマセン。。。 # 確認してから書き込めばよかった・・・(^^A;

  • mrumesuke
  • ベストアンサー率45% (254/557)
回答No.1

4A 5D 36 38...って文字コードなんですか? UTF-8でもないようですが。。。 CA DD B6 B8 B6 C0 B6 C5ではないですか? そうだと仮定して話を進めると、バイナリエディタで直接バリナリデータを参照すればよろしいかと。 CA DD...の場合、参考URLのStirlingでキャラクターセットSHIFT-JISを選択すると「ハンカクカタカナ」が、EUCを選択すると「保狂鏡凝」が表示されます。 (4A 5D 36 38...では「J]68」です。) 動作OS:Windows98 Windows95 WindowsNTとなっていますが、2000でもXPでも動作するようです。

参考URL:
http://www.vector.co.jp/soft/win95/util/se079072.html

関連するQ&A

  • 1バイト文字から2バイト文字に変換

    C言語にて Char a = "-"; 上記のような直打ちのASCII(1バイト文字)をUCS-2(2バイト文字)に文字コードを利用して変換する方法がわかりません。 わかる方がいらっしゃいましたら助けて頂けるとありがたいです。

  • 文字化け!!!!

    Macユーザーからメールをもらうと、たまに d?b?ナ???オ?ト?ン?ワ?キ?B?ア?フ?ヤ?d?b?オ?ス???ク?チ?ニ?ハ?カ?ネ?ゥ?チ?ス???セ?ッ?ヌ?B 、、、といった感じで文字化けしてしまいます。 なぜでしょう? 修正の仕方、修正ソフト知っていたら教えてください! ちなみに、私のマシーンは Win ME搭載VAIOです

  • UTF8コードで1バイトの文字が2バイトで表現されているのですが・・・・?

    UTF8コードで1バイトの文字が2バイトで表現されているのですが・・・・? とタイトルの通りデータに    UTF-8のデータを扱っていて  16進表記で『0xC341』と  データが入ってきました。 0xC3…11000011  0x41…01000001 UTF-8の仕様で2バイト目の文字は先頭ビットが 10 から始まる仕様となっていると思いますが  2バイト目の先頭ビットが 0 の場合はUTF-8コードが  壊れていると判定してもいいんですか?    それとも、2バイトの先頭ビットが0の場合  次のバイトを1バイト文字とし変換してあげて  0x41 → A として変換するなどといった  特殊な仕様が隠れていたりするのでしょうか?    今のところ壊れていると判断しているのですが、  UTF-8ではないコードだったりする可能性もあるかな?  っと思い質問いたしました。  少し不安だったので、しっていましたら、教えてください。                          以上   検索ワード UTF-8 2バイト目 1バイト文字

  • ギャル文字読めますか!?

    ギャル文字読める人いませんか!? 題名 今カゝяа圏外ナょっちゃう→(汗;) 本文: (≠ょぅσ∋ゑ、ちヵゝ<маτ〃レヽ<ωナニ〃レナ`⊂〃ぁぇナょレヽヵゝナょぁ?? 七±ι,ζ,〃レ|(ニぁっτl£ナょιナニレヽ=├м○レヽっl£oレヽぁゐι、ナニ〃乂ヵヽナょぁ?? とりあえず圏外になっちゃうんだ!!って事はわかったんですが・・・。 この文の前には「ふざけて特にギャル文字にしてみたよっ↓↓↓」 って感じのが軽い(?)ギャル文字で書いてありました。 この部分さっぱりすっかり内容がわかりません。 もぅギブアップです(疲)これ解読できますか!?

  • UTF-8で5~6バイトになる文字コード

    UnicodeのUTF-8で5~6バイトになる文字コードは、どのような場合でしょうか。(サロゲートペアのコードでも4バイトです。シフトJISから変換するとき、どのようなコードが5~6バイトに割り当てられるのでしょうか。) ご存知の方おられましたら、ご教示ください。

  • 1バイト文字と2バイト文字の区別の仕方

    C++についての質問です。 簡単な質問で大変申し訳ございません。 '\'や'&'などSQLインジェクションに 関係する文字コードについて 空白に変換する処理をいれていたところ、 カタカナの「ソ」(%83%5c)など も変換されてしまい、 文字化けしてしまうという現象が起きています。 '\'は、'%5c'のため、カタカナの「ソ」は、 それと同じ'5c'のコードが 2バイト目入ってしまっているからだと いう原因までは、 把握しているのですが、 対処の仕方がわかりません。 簡単な質問で申し訳ございませんが ご教示願います。

  • 2バイト文字をJEFからSJISに変換したい

    文字コード、JEFからSJISへ変換したいのですが、 2バイト文字をどのように置き換えればよいでしょうか? JEFコードは、'28'~'29'で括った範囲が漢字コード扱いになるということでなんとかできそうな気がしますが方法が思いつきません。 又、JEFコードからSJISへ変換してくるソフトウェア(UNIX版)などありますでしょうか?

  • 16進数の文字列を文章に変える

    プログラミングに関しては全く分からない者です。 先日、とある文字列が友人から送られてきました。 0から9までの数字とaからfのアルファベットで構成されているので、16進数の暗号なのかと検討をつけました。 ネットで「16進数 文字列 変換」などと検索して、変換ツールなどを試してみたのですが、うまく変換されません。 Excelあたりを使って、どうにか解読する方法はありませんか? また、そういった文字列というのは、プログラミング言語や文字コードによって、同じ文章でも変わってしまうものなのでしょうか? よろしくお願いします。

  • 文字化けの解決方法教えて下さい

    スペインに住んでいる中国人の友人からのメールが文字化けしていて読めません(@_@;) どうしたら解読できるのか教えてくださいm(__)m ちなみにこんな感じです 鄒守ゥゅ■繧・s 荵・@縺カ繧岩€ヲ 蟷ク縺帙↑螳カ譌上・蜀咏悄縺ゅj縺後→縺�(^O^)・上ヲ繝ュ繧ュ縺上s縲∝、ァ縺阪¥縺ェ縺」縺溘・

  • 3バイトの暗号解読です。

    みなさん、こんにちは。3バイトの暗号解読でとても困っています。どなたか助けて頂けないでしょうか? 3バイトのチャレンジコード(上段)に対し、3バイトのレスポンスコード(下段)が返されます。鍵(キーコード)も暗号化ロジック(これが知りたいのです)も分かりません。 下記に4例示します。破ることは可能でしょうか? 1. 86 5E 3C 0E 6E 96 2. 09 D4 D4 94 93 18 3. 56 B5 7D 7C 67 DB 4. 60 3C E6 F7 BB D6 です。大変お手数ですが、どうぞ、よろしくお願いします。 皆さん、どうもありがとうございます。 間違っても、犯罪には利用しません。 何とか、ヒントというか、きっかけがつかめればよいのですが。

専門家に質問してみよう