• ベストアンサー

日本の友達へ 漢字のふりかなを取得すること

最近、日本のプロジェクトをしています。 漢字から漢字のふりかなを取得することを困っている。 例えば: 漢字:松戸 私は欲しいものには「まつど」を取得して、 開発言語はC#です。 OSはXp2. いくら探しても解決できないことになりました。 もし、助けてくれば、本当にありがとうございました。 ============================ 働いても、働いても、相変わらず貧しい人だった。 ============================

質問者が選んだベストアンサー

  • ベストアンサー
  • mtaka2
  • ベストアンサー率73% (867/1179)
回答No.3

人名・地名などの固有名詞は複数の読み方があることも多く、自動で処理するのは難しいと思いますが、 一般的な日本語の文章で漢字からひらがなに変換するのであれば、 日本語の形態素解析を行う「茶筌」(Chasen)というライブラリがあります。 http://chasen-legacy.sourceforge.jp/ C#で利用するのであれば、「茶筌forC#」を併用すると便利でしょう。 http://www.vector.co.jp/soft/win95/prog/se329862.html

sky-star
質問者

お礼

ご丁寧回答ありがとうございました。

その他の回答 (2)

  • titokani
  • ベストアンサー率19% (341/1726)
回答No.2

ImmGetConversionListを使えばできるかもしれません。 ただ、#1さんもおっしゃるように、漢字の読みは何通りか存在するので、 いくつかの候補の中からどれを選択するのかが問題ですね。

sky-star
質問者

お礼

ご提案いただけまして、ありがとうございました。

  • FEX2053
  • ベストアンサー率37% (7987/21355)
回答No.1

漢字の振り仮名は、同じ漢字でもどう読むかが一定でないため、 相手がテキストファイルの場合、取得する方法はありません。 自分で読んで、書き込む以外に方法はないのです。 相手がExcelブックの場合、入力時のカナを保持しているために =PHONETIC() という関数で取り出すことが出来ますが、 これも「Excelでカナ入力をしている」ことが前提になります。 カナ入力をしていない漢字データ(例えばテキストファイルを 読み込ませた場合)に対してPHONETIC関数を使うと、正しい読み が出てくる場合とメチャメチャな読みが出てくる場合があり、 実務的には全く使えないです。 ちなみにWord文書でも入力時のカナは保持していますが、 簡単に引っ張り出す方法はありません。 では、一般的なプログラムの場合どうするか、と言えば、 漢字フィールドとカナフィールドを別々に持たせる、という方法を とります。特に氏名は特殊な読み方をしますので必ず「漢字氏名」 「カナ氏名」の2項目が必要になります。 住所に関しては、特段「読める」必要はありませんので(漢字の ままで発送などが出来る)、漢字住所だけで済みます。

sky-star
質問者

お礼

ご提示いただきまして、ありがとうございました。 これは住所と名前に対して特に要求がありません。 日本語初心者は漢字を見ながら、意味が分かりますけど、読み方は迷っています、そのため、漢字より、読み方を表示するよう考えています。

関連するQ&A

  • 漢字読み取得方法

    こんにちは vb.net環境で開発しておりまして、 漢字の読みを取得する方法はないかと調べています。 (キーボードから入力というより、コピーへで入力されたものを変換という感じです) 例、日本好き→にほんすき

  • 漢検の上位級取得を目指して、漢字の勉強をしているのですが、

    漢検の上位級取得を目指して、漢字の勉強をしているのですが、 準1級や1級ともなると、辞書にも載っていないような言葉がたくさん出てきます。 広辞苑や漢語林、日本国語大辞典にすら載っていないような言葉は どのように調べたら良いのでしょうか? みなさんはどのように解決しているのか教えてください。

  • 漢字を作ったのはだれ?

    私は日本人です。 漢字は中国人が作った文字だと思っていました。ところが最近、漢字は韓国人が作った文字だという学説(?)が現われたとか?? いったい、本当のところはどうなんでしょうか。

  • Vistaでの漢字変換について

    最近PCを購入し、OSがXPよりVistaへ変わりました。 過去の質問から検索し、マイクロソフトのサポートの手順を全部行ってみたのですが、漢字変換ができません。 WordやExcelは可能です。またインターネットでも漢字変換可能なサイトとそうでないサイトがあります。 早急に解決したいのでどなたか教えてください。

  • Windows XP pro(英語版)印刷時文字化け

    多言語サポートをインストールした英語版XPprofessional上で日本語を表示させるソフトを親会社(スイス、イタリア)で開発しています。 OSの日本語表示や、C++で開発したアプリケーションソフトは画面上では日本語の表示が出来ますが、開発したソフトで印刷すると文字化けしてしまいます。 中国語の漢字は化けません。日本語だけが化けます。 フォントはMS UI Gothicを使っています。 同じ様な経験をされた方はいらっしゃいませんでしょうか? どのように解決されましたか? 宜しくお願いいたします。

  • グローバルIPの取得方法を教えてください。

    グローバルIPの取得方法を教えてください。 ルータを経由してインターネットに接続するPCの グローバルIP(ルータのIPになるんでしょうか?)を取得する 方法を教えてください。 開発言語はC#.netです。

  • 漢字伝来以前の日本語。

    漢字伝来以前の日本語に興味があります。 1.話し言葉 文字以前の日本語はどのような発展をしていったのでしょうか? 無文字言語(もっとスマートに言いたい…)を持つアイヌと 何かつながりがあるのでしょうか? 2.書き言葉 日本には漢字伝来以前にも、文字社会があったという話を 聞いたことがあります。ヒエログリフでしたっけ? よくわからないのですが、何種類かあったようですね。 僕は本当に漠然としたことしか知りません。 少しでも、この純(?)日本文字について教えてください。 上記1、2の質問で両方とも太平洋諸国とのつながりは ありますでしょうか? 教えてくださいよろしくお願いします。

  • glob関数で日本語文字が取得できません。

    PHPでglob()関数を使って画像ファイル一覧を取得しようと試みたのですが、引数に"C:/Documents and Settings/xxxxxx/My Documents/My Pictures/風景/*.jpg" といった引数にすると日本語部分の文字が文字化けしているようで取得できません。 glob関数は2バイト文字は使えないのでしょうか? それともOSとの文字化けの関係なのでしょうか? 解決するにはどうしたらいいのでしょう? [実行環境] OS : Windows XP PHP version : 5.1.6 Server: Apache 2.2.3;

    • ベストアンサー
    • PHP
  • C#でのDLL

    OS  :WindowsXP Pro SP1 開発環境:VisualStudio .NET 2003 開発言語:C# 開発形態:Windowsアプリケーション 開発初心者です。よろしくお願い致します。 テキストファイルを読み込んで、その中にある文字列を3つほど返却値として返すDLLを作成したいと思っています。 新規にクラスライブラリのテンプレートでプロジェクトを作成し、プロジェクトメニューからコンポーネントの追加をしました。 質問事項 1.まず、DLLを作成する手順として、上記の方法でよろしいのでしょうか? 2.ファイルからテキストを取得するところまではできるのですが、それを返却値として、呼び出し元の別プロジェクトへは、どうすればよいのでしょうか? どなたか、ご教授お願い致します。

  • 日本における漢字による新語造語力はすでに死滅したか

    コロナ禍の最中にも安直なカタカナ語が飛び交い、一方マンボウの略称がよろしくないなど、言語のレベルの混乱も多いように思います。明治初期までの生き生きとした漢字による新造語はもはや現在の日本では作れないのでしょうか。以前にも同じような質問をしたかと思いますが、最近改めてこのような疑問がわきました。