• ベストアンサー

Perlで日本語の文章にカナを振りたいのですが

Perlで日本語の文章にカナを振りたいのですが 何か良いサブルーチンなど無いでしょうか? 漢字に読み方が沢山ありますし、活用による語尾の変化もあります。 カナさえ振れればいいです。 あるいは、日本や海外のサイトのサービスでもいいです。 出来るだけ、スパっと一通りの正しい読みが得られるといいですのですが。

  • Perl
  • 回答数1
  • ありがとう数14

質問者が選んだベストアンサー

  • ベストアンサー
  • trapezium
  • ベストアンサー率62% (276/442)
回答No.1

Kakasi, ChaSen, MeCab などで工夫するとか、もちろん完璧ではないですが。

関連するQ&A

  • 日本語教育文法について

    日本語教育文法では国文法の「助動詞」を「活用語尾」などとしているそうですが、国文法における活用語尾(例えば、「(読)ま(ない)」、「(読)み(ます)」などの「ま」や「み」)と助動詞の「ない」や「ます」をどう区別するのでしょうか。両方とも活用語尾と呼ぶのはおかしいのではないでしょうか。また、「た」や「ようだ」などの助動詞を動詞や形容詞の一部として活用語尾とするのは無理ではないでしょうか。 「活用する後置詞」とするのはどうでしょうか。

  • 活用のある語、ない語

    (参考書の説明で) 送り仮名の付け方には原則で活用のある語は活用語尾を送る、とあり例として 承る-承らない-承ります・・・ 、とあります。 基本的な質問ですが、活用のない語にはどのような語(動詞)があるのでしょう?またその語の送り仮名をどう付けるかについて教えてください。

  • 「小さい」  の送り仮名について

    「小さい」 の送り仮名は、なぜ 「小い」 ではないのでしょうか。 日本語の送り仮名の規準は、内閣告示 「送り仮名の付け方」(昭和48年 昭和56年一部改正) にあり、 「広辞苑」 をはじめとする国語辞典や古語辞典も、これに従っているようです。 「送り仮名の付け方」 によれば、形容詞は活用語尾を送ります(ただし、語幹が 「し」 で終わる形容詞は 「し」 から)。 その例外として、八つの形容詞があげられています(明るい/危ない/危うい/大きい/少ない/小さい/冷たい/平たい)。 例外的な送り仮名には、ほかの読み方との混同を避ける働きがあるようです。 たとえば、 「少ない」 を 「少い」 にすると、 「少し」 が 「すくなし」(古語) なのか 「すこし」 なのか、わからなくなってしまいます。 ところが、 「小さい」 だけは、そういう合理的な理由が思いあたりません。 たとえば、「大きい」 の場合には、「大(おお)」 という読みが接頭語として自立しています。 「小(ちい)」 は、それに対応しているのでしょうか。 接頭語としての 「大(おお)」 の対義語は 「小(こ)または(お)」 で、辞書では 「小(ちい)」 という項目をみつけることができなかったのですが。 送り仮名には 「一貫した理法など由来存しない」(「新明解国語辞典 第三版」) といってしまえばそれまでですが、 「小さい」 の送り仮名の必然性を合理的あるいは歴史的に説明できる方がいらっしゃったら、教えてください。 文化庁 「送り仮名の付け方」 http://www.bunka.go.jp/kokugo/frame.asp?tm=20060513003348

  • 掲示板で日本語を含まない文章を禁止したい

    perlのcgiの掲示板で、荒らしの書込みがひどいです。 おそらく外国の悪質ないたずらで、勝手に書き込まれて いっているものです。毎日50件くらいあって、削除するのも大変です。 荒らしの文章には平仮名、片仮名、漢字が含まれていないので、 日本語を入力しないと書き込めないようにしたいです。 日本語かどうかの判別は、平仮名の有無にしたいと思います。 とあるサイトからダウンロードさせてもらった掲示板 なのですが、そこのサイトはここ2年間くらい更新されていないので、 相談しても無駄だと思ってので、ここでききたいとおもいました。 前に同じような質問(http://oshiete1.goo.ne.jp/kotaeru.php3?qid=2339456) をしたのですが、状況が変わったのでまた質問させていただきました。

    • ベストアンサー
    • CGI
  • 漢字かな混じりの店名を中国語表記

    日本のお店の名前を中国語で表記するには、漢字をそのまま中国語読みするのが一般的だと思います。 しかし、漢字かな混じりの場合はどうしたらいいでしょうか? 例えば 牛丼のチェーン店 「すき家」は 中国語では “食其家”と表記されるようです。 ところで、四国では割と有名な讃岐うどんチェーンの「たも屋」がこの前、シンガポールに出店しましたが、シンガポールと言えば、 英語のほかに中国語も公用語になっていますが、中国語で この「たも屋」はどのように表記しているんでしょうか?

  • 日本語について質問があります。

    日本語について質問があります。 私は日本人ですが、日本語を勉強している外国の方と日本語で会話をしていて、この外国の方の日本語の語尾が少し変だと思ったので、初めてですがここにて質問させていただきました。 例えば「これは甘い」という文章でしたら、この外国の方は語尾に「これは甘いだ」と「だ」を付けて言います。 「これは甘いだ」は、日本人同士でも聞いたことがないので、ちょっと変だと思いました。 でも、同じ「だ」でも、例えば「これは綺麗だ」の文章は、普通に正しいと思うのです。 なので、同じ「だ」を語尾に付ける時には何かルールがあるのでしょうか? 語尾なんて物は自然に使い分けている事ですが、これを人に説明しようとすると出来なくて恥ずかしいです。 あと、因みにこの外国の方は、疑問文でない動詞の語尾にも「だ」を付けます。例えば「会うだ」「食べるだ」「聞いただ」の様に。。。面白いけども、どうしてそんなに「だ」を付けるのか私は気になって仕方ないのです。 すみません、本当にどうでもいい事かもしれませんが、宜しくお願い致します。

  • office IME 2007を、日本語カナ入力を優先的にすることはで

    office IME 2007を、日本語カナ入力を優先的にすることはできませんか? OSは、windos7です。 私は、日本語カナ入力でやってますが、カナ設定してもインターネットで別のサイトに行ってしまうと 英数入力になります、これを、サイトが変わってもずっと、カナ入力のママは出ませんか?

  • 日本語が漢字かな混じり文を考案したのは偶然?

    日本語は漢字仮名混じり文で表記しますが、そのことに関して疑問を持つ人は少ないかもしれません。 とある漢和辞典でも 日本人が漢字を消化し使いこなせるようになったのは当然のようなことが書いてありました。 しかし、日本と同じように古代から中国文化を大きく受けた韓国では専らハングルで自国語を表記するし、ベトナムは漢字を捨てました。モンゴルは歴史的には中国とかかわりが大きかったですが、漢字を含め中国の文化はあまり取り入れませんでした。 日本の場合、漢字の他にも次のような選択肢もあったはずです。 (1) 仮名だけで書く・・・・漢字仮名交じり文が確立したのは平安時代になったからであり、大昔の日本語は万葉仮名で書かれていました。 (2) 梵字を改良した文字で書く ・・・・ 日本語の五十音の配列は 梵語の影響があるらしいです。 また、梵字の存在も大昔から知られていたはずです。 近代まで、仮名は同じ音を表すにもいくつかの文字があり統一されいなかったので、梵字を使う手もあったはずです。 (3) ラテンアルファベットで書く ・・・・ もし、日本が鎖国をしなければ ポルトガルやスペインの宣教師が キリスト教と共にラテンアルファベットを日本に普及させていた可能性もあります。また、明治になってから 欧米との交流も盛んになり、ローマ字論も俎上に上がりましたし、戦後、GHQが英語を公用語化し、日本語もローマ字で書くことが定着する可能性だってあったはずです。 (4) 全く日本独自の文字で書く・・・・真偽のほどは分かりませんが、日本にも漢字が伝来する前に 阿比留文字とか神代文字というのがあったそうです。もしくは、大昔の学者が 韓国語におけるハングルのように 合理的な文字を考案する余地もあったはずです。 (5) キリル文字で書く・・・・ もし、北海道がロシア領になっていたら 日本語のキリル文字での正書法も確立していたかもしれません。 ロシアの国境とまたがって住んでいる民族でも 国境を界に 自国語を違う文字で表記するという現象がよくあります。 そこで質問です。日本語が漢字仮名交じり文を用いるのは必然的だったと思いますか? また、日本語が 韓国語やベトナム語などと決定的に違うのは何なのでしょうか?

  • 日本語の漢字の読みは中国語に比べてやっぱり多いんでしょうか 中国語では規制されていると聞いたんですが本当ですか

    日本語の漢字の読みは中国語に比べてやっぱり多いんでしょうか 中国語では規制されていると聞いたんですが本当ですか 中国語でも2つ以上の読み方がある漢字はありますか?? 日本語の「下」みたいに、8つくらい読みがある漢字はありますかね

  • 日本語の締め付けるは締付けると書くのは何の規則です

    日本語の締め付けるは締付けると書くのは何の規則ですか? どうも送り仮名の平仮名は漢字の最後のみという日本語ルールはどこから来てるのか教えて下さい。 平仮名 しめつける を漢字にすると、 間違い 締め付ける 正しい 締付ける 間違い 締付 漢字だけに集約するのも間違い。なぜ?

専門家に質問してみよう