• 締切済み

生起確率の求め方

与えられた英文(txtファイルやdocファイルなど)におけるアルファベットの生起確率を求めるプログラミングをどなたか教えて頂けませんでしょうか。 例えば、 aabcdeefだとaとeの生起個数は2で他が1なので、一つずつカウントしながら簡単に求められます。 プログラムでも英語の長文の中にあるアルファベットを一つずつ数えながらそれで生起個数を求め、ファイルの文字数と照らし合わせて生起確率を求めるという方法が簡単でしょうか? 回答宜しくお願いします。

みんなの回答

回答No.1

> 英語の長文の中にあるアルファベットを一つずつ数えながら > それで生起個数を求め、ファイルの文字数と照らし合わせて > 生起確率を求めるという方法が簡単でしょうか? というか、他に手段がありません。

関連するQ&A

  • テキストファイルを読み込んでソートするプログラム

    英文のテキストファイルを読み込んで、単語を一行に一単語ずつ並べた後、それをアルファベット順にソートして、同じ単語を消去したテキストファイルを作るプログラミングを作りたいと思っています。 しかしテキストファイルを読み込むという命令がよくわかりません。 isalpha()などを使ってプログラム内に打ち込んだ英文を単語ごとに分けるプログラムは出来たのですが、テキストファイル(.txt)はどうやって読み込めばいいんでしょうか? プログラムはGNOMEのXEmacsで作っていて、C言語です。

  • C++ 文字数カウントについて。

    こんにちは。 C++ についてお尋ねします。 下のx.txtをインプットすると、y.txtがアウトプットされるC++プログラムを作りたいです。 while { } を使うことが条件です。しかし、なかなか出来ません。 while { } で文字数カウントの方法を中心に教えてください。 よろしくお願いします。 大文字、小文字共にカウントします。 例: A と a 両方カウントします。 x.txt の内容--- ll chA chI ll chU chE ll chO jyo ll shi shu ll she sho l nyi nyu nyo ---------------- ↓↓ y.txt の内容------------------- 母音の数、行数、文字数。 a の個数: 1 e の個数: 2 i の個数: 3 o の個数: 4 u の個数: 3 line の個数: 5 総文字数(全てのキャラクター): 68 -----------------------------------

  • terapadを使って、perlについての問題です。

    terapadを使って、perlについての問題です。 第一問はある英語の文書ファイルから、その文書の段落の数、文の数、単語の数をカウントするプログラム。段落の区きりが改行で、文の区きりは、「 .」(半角スペース2個に.1個)で、文字の区きりは、「 」(半角スペース)あるとする。 第二問はある単語ファイル(例えばtest.txt)に乗っている単語リスト(1行1単語)の単語の意味を調査し(辞書は先に用意したファイルで調査するdictionary.txt)、その結果をファイルに保存するプログラムを作成するプログラム。(ファイル名をout.txtする)そのプログラムを提出すること。 誰か教えてください、プログラミングの初心者なので…全く思いつかない。><

  • ハフマン符号化プログラミング

     学校の課題でVisualStudioで実現できるハフマン符号化プログラム(3次拡大)を作成せよ。という課題が出題されました。  しかし私は今まで入門程度のプログラミングしかやったことがなく、。指定されたファイルの文字数を調べる程度の事しかできない程度のプログラミングの知識なのでさっぱりです。  指定されたtxtファイルを読み込んで、文字数を数えて、文字の種類を調べて、各文字の発生確率を調べて、各文字を3次拡大行列にし、ツリー構造のアルゴリズムを作成し、各値を2進数に変換して、2進数に変換したものをtxtファイルにして保存するということは何となくわかるのですが、それを実現する知識がありません。  プログラミングの知識をお持ちの方のご協力をお願いいたします。

  • C++で文字をカウントするプログラムを・・・

    C++で簡易的な文字をカウントするプログラムを作成しようとしています。 あるtxtファイルがあって、その中に ----------------- nannchara8 1234 #kokokara a92kv838 402853 #s82ffr kka0345 #kokomade ----------------- と記述してあります。 #kokokara~#kokomadeに書いてある特定の文字(0やaなど)の数をカウント、ただし、行頭に#のついているものはカウントしない(上に示したtxtファイル内の文字「8」のカウント結果は3・・・みたいな」)。 そんなプログラムを作りたいのですが どのようにすればいいでしょうか? ご教授願います。

  • PDFファイルを、ワード形式で保存する方法について

    ACROBAT 6を使用しているのですが、ある英語で書かれたPDFファイルを ワードのdocファイルかtxtファイルにしたいのですが、どうすれば可能でしょうか? なお、ファイルの名前を付けて保存の際、docファイルを指定すると、docファイルに 画像データを貼り付けたファイルになり、またtxtファイルを指定すると中身が無い ファイルが出来ます。

  • ページ数を表示するフィールド

    使用ソフト:Microsoft-Word ver.2002 SP3 Wordについて質問があります。ページ数を表示するフィールドはNumPagesですが、 複数の.docファイルをまたいでページ数をカウントすることはできないように見えます。 複数の.docファイルをまたいでページ数をカウントし、文書内に表示する方法があればご教授願えますか?

  • perlで一定の範囲ごとにカウントさせる方法について教えてください。

    perlで一定の範囲ごとにカウントさせる方法について教えてください。 例えば、data.txtに、-10≦n≦10の範囲で様々な数が入ったファイルがあるとして、 -10.0 ≦ x < -9.9 -9.9 ≦ x < -9.8 .... 9.8 ≦ x < 9.9 9.9 ≦ x ≦ 10.0 (←最後は≦のほうがいいですが、<でもOK) と0.1ごとに区切って、 その範囲に入る数をカウントしたいとき、 ifや+=を使って範囲を指定して、カウントアップさせる方法もありますが、 指定したい範囲の数が多いと、ifばかりをプログラム内に羅列するのは面倒です。 できれば以下のような結果が表示されるとうれしいのですが… 中間値 カウント数 -9.95 3 -9.85 6 ... すっきりした書き方はありませんか?よろしくお願いします。

  • ファイル選択ダイアログで複数の拡張子を有効に

    Ruby+VisualuRubyでプログラムを作っています。 ファイル選択ダイアログで file_name = SWin::CommonDialog::openFilename(nil, [["テキスト(*.txt)","*.txt"],["DOC(*.doc)","*.doc"],["DOCX(*.docx)","*.docx"]], 0x1000, "ファイル選択") とすれば、複数の拡張子からの選択が可能になるのはわかったのですが、 これだと、拡張子を選んで、その拡張子のファイルから選択することになります。 同時に、複数の拡張子のファイルを表示し、その中から選択するようにはできないのでしょうか?

    • ベストアンサー
    • Ruby
  • いくつかのファイルの一致を確認するプログラミングの作り方。

    いくつかのファイルの一致を確認するプログラミングの作り方。 例えば7個のtxtファイル a, b, c, d, e, f, g があるとします。 a, b, c, d, e, f, g はそれぞれのファイルのファイル名です。 そのうち、 a, b, g のファイルの内容が全く同じであった場合、 a, b, g は一致していると判断するには、どんなプログラムを作成すればよいのでしょう? ちなみにファイルの中身は 数字が配列のように並んでおり、文字数は5000文字程度です。