• 締切済み

表記のゆれを吸収する方法

benderの回答

  • bender
  • ベストアンサー率45% (108/236)
回答No.2

複数の文字列が与えられたとき、それらの共通する部分と異なる部分についての研究は、自然言語処理のほかにも、生物情報学の研究の一環として、例えばタンパク質内のアミノ酸の並び方について、すでに多くの研究がされてきたことと思います。 独自に考える以前に、既存のプログラムを試してみたり、これらの分野の文献を検索するか、あるいは学生であれば、先生に直接尋ねることが有効だと思われます。 また、ここで質問されるのであれば、Perl、あるいは、その他プログラミング、または、生物学の分野で質問をした方がよいように思います。

関連するQ&A

  • ATOKによる表記ゆれ防止策に関しまして

    表記ゆれ、すなわち『組み立て』、『組立て』、『組立』などの、同じ発音で意味も同じであるが違う文字列で書かれるといったものを、ATOKのユーザ辞書機能を用いて入力時に防止する方法を検討しております。 私としましては、上記の3つの表記ゆれを組み立てとしたい場合は、 読み:くみたて 単語:組み立て と登録すれば、『くみたて』と入力した時に、『組み立て』と候補の一番上に来るのでこれでいいのかと思うのですが、『組み立て』などの単語は標準の辞書にもともと入っているのでこの方法でいいものか迷っております。 もし、なにかいいアドバイスがありましたら回答いただけるとありがたいです。 すみませんが、よろしくお願いいたします。

  • 外来語表記で元の言語音をベースに「ヂ」と「ジ」を区別しないのはなぜ?

    最近では外来語表記で、元の音にできるだけ忠実に表記しようと、日本語の「音韻」としてはオフィシャルでないものも、表記では分けられることも多くなりました。 良い例が、外来語のVをヴァ行で書く方法です。発音上はバ行と同じでも、表記の上で区別することもあります。 そこで疑問なのは、例えば英語では、usualのsと、JapanのJというように、有声硬口蓋歯茎音の摩擦音と破擦音が、音韻上対立してます。 にも関わらず、この音韻ルールが無視されどちらも「ジ」で表記されるのはなぜでしょう? 日本語には現在でも方言によっては「ジ」と「ヂ」、「ズ」と「ヅ」が音韻上の対立があると聞きます。(実際にこれらの方言のネイティブ発音を聞いたことはないので、純粋に有声摩擦/破擦の違いかどうかは知りません。) 標準語を含む多くの方言では発音上の区別は無くても、「自分」の「ジ」と「鼻血」の「ヂ」というように、表記上の区別は存在します。 だったら、ヴァ行という新しい表記法を作りだすより、「ジ」と「ヂ」を区別する方がはるかに簡単だと思うのですが? 英語のこの区別は受験の発音問題でも出るので、英語にはこの区別が存在するということを知るだけでも、受験生にも随分楽になるのではないでしょうか? 聞き取りの上でも、個人的には、英語のbとvの違いに比べて、jとzhの違いの方が日本人にとって難しいとは思いません。日本語にshとchの区別があるので、jとzhもコツさえつかめばあきらかに違う音に聞こえるはずです。 なぜ外来語表記で、ジとヂの区別が定着しないのでしょうか? ※ 余談ですが、日本の英語のテキストではよくcarsとcardsが、あたりまえのようにジ/ヂと同格扱いされて、「カーズ」「カーヅ」と書かれたりしますが、「英語の音韻」だけを考えれば、「ジ/ヂ」と「ズ/ヅ」を同格扱いするのはおかしいですよね?「カーズ」と「カードズ」の方がconsistentでしょう(笑)。あくまで「音韻」だけを考えた場合なので、現実はそんな単純じゃないですがね。

  • “子音字+y”で終わる英単語の片仮名表記

     -ar,-er,-or で終わる英単語の片仮名表記には揺れが見られますが,“子音字+y”で終わる場合にも揺れが見られます。後者の場合,英語では伸ばさずに発音します。ところが片仮名表記では普通,長音符号“ー”を付けます(最近は原語の発音を尊重して付けない場合も多いが)。  なぜこのような事態になったのでしょうか。

  • 用語のゆれのチェックをサポートするツール

    用語のゆれのチェックをサポートするツール 文書内の単語/用語の統一化を図るため(チェック)のため、WORDで作成した文書の中で 例えば、”弊社“と"当社”という語を使用していた場合、どちらかに決め置換したりして統一を図るのですが、 類似の言葉がないかをまずチェックする作業が必要であり、通常は文書を読んでいって、この言葉は類似のものがあったななどとやると思います。 そこで機械的に何かツールで文書で使用している単語一覧を出力できるようなものはないでしょうか。 なお文書は、WORD2003で作っています。

  • 英語の単語を縦書きで表記する場合、右向き・左向き?

    表などの作成で、英語の単語を縦書きで表記せざるを得ない場合、単語の文字は(通常の横書きで表記したときの文字の上部を)右側・左側のどちらに向けるのが一般的でしょうか? なお、これは、MS-WORD やMS-EXCEL MS-POWERPOINTなどのソフトウェアで、文字を縦書きに表記するテクニックをお尋ねしているわけではありません。

  • セルを空白にしたら「0(ゼロ)」を表記させる方法

    セルを空白にしたら「0(ゼロ)」を表記させる方法の質問です。 「F5~F38」「H5~H38」「J5~J38」「L5~L38」「N5~N38」「P5~P38」「R5~R38」「D6~D38」「E5~E36」「T5~T36」「U5~U38」の範囲のセルに数字や文字を入力します。 上記範囲のセルに入力した数字や文字を消して、空白表示にした場合は自動で「0(ゼロ)」と表記させる方法はあるのでしょうか?

  • 単語表記について教えて下さい

    会社で資料を作成しています。その中で、社名の頭文字を別の意味合いにして理念としているのですが、単語がしっくりきません。前任が作成した物なので言いづらいこともあるのですが、具体的には、「J」をJointと表記し、社会との結びつきを説明しているのですが、この場合、直訳でいくと結合などの意味になりので、Joinの方が表記としては正しいのでしょうか? おわかりになりそうな方、教えて下さい。

  • 文字から英単語を検索する方法/ツール

    文字を入力したら、その文字を組み合わせた英単語を出してくれるような方法(ツール)は無いでしょうか 例:  入力→bcde  出力→be,bed,cd,......

  • C言語でタイピングゲーム作成

    C言語でタイピングのプログラムを作りたいと思っています。 仕様は以下の通りです。 1、文字列出力とタイピング機能 出力する英単語は、プログラムの中で文字配列として定義しておく。英単語はすべて小文字 のみとする。まず、配列の先頭から1つ英単語を出力してそれをタイピングさせる。 そして次の英単語、また次の英単語と、最後の英単語まで出力とタイピングを繰り返す。 2.照合とカウント 入力文字を一文字ずつ照合して、あってるか間違っているかを判定しカウントする。 定義した配列のすべての英単語についてタイピングと照合を終えたら、タイピング成績の出 力へ進む。 3. タイピングの成績出力 タイピングの成績を出力する。何文字正しく入力できたかを%で出力する。 以上です。 理解を深めるために、ソースに説明を入れて書いていただけるとありがたいです! 回答よろしくお願いいたします

  • エクセル イコールで別シートより値を引いた場合の表記について

    無理かな・・と思いますが・・。 ひとつのエクセルで、Aのシートの値を、Bのシートに 「イコール」を用いて表記するとします。 そこで、「5/27」のような日にちをAのシートから Bのシートへ引くとします。 ※Aのシートでは、都合上「文字列」で日付を表記しております。 ※Bのシートのセルも「文字列」に設定しております。 すると、イコールで引いたBのシートには、Aのシートに値入力を していない状態の場合「1/0」と表記されてしまいます。 値入力がない場合は、"ブランク"もしくは"-"といった表記に 変更したいのですが、可能なのでしょうか? Bのシートは、支払い明細書となっており、なるべく手を加えずに 発行する。というのが希望です。 値が入らない箇所の「1/0」を随時プリントの際に、Deleteすれば いい話なのですが、もし策があるのであれば知りたいのですが。 もしご存知の方いらっしゃれば、教えてください。 よろしくお願い申し上げます。