• ベストアンサー

文章の数 emacs(mule)

はじめまして。 emacs(mule)で日本語の文章を書いたのですが、 その文章数を知りたいのですが、 どのようなコマンドを実行すればよいのでしょうか? …や。、?、」などで終わっているので、苦戦しております。 LINUXを使用しています。 どうか、よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • astronaut
  • ベストアンサー率58% (303/516)
回答No.4

とにかく,正確に数えたいなら,パターンをきちんと把握しないと始まらないのに,その情報がありません. 終わりの文字が … 。 ? 」 の4種類だとして,単にこれらの出現数を数えるだけなら簡単ですよね. perl なら以下のような感じでしょうか. #!/usr/bin/perl $re_end="。|」|…|?"; open IN, "hoge.txt"; $n=0; while(<IN>){ @matched = /($re_end)/g; $n += ($#matched + 1); } print "$n\n"; これらの文字のあとにセンテンスが続くような場合は,そういうパターンが除かれるように,確実に正規表現 $re_end に表してやれば良いわけですが,難しいでしょうかね.

yoshio_special
質問者

お礼

パールが少し苦手なので、わかりづらいのですが、。などのあとにも文章が続くので、なんとも言えないですね。 … 。 ? 」 の文字の個数を数えてそこから、文章の数を出してみようかと思います。 どうもありがとうございます。

その他の回答 (3)

  • nightowl
  • ベストアンサー率44% (490/1101)
回答No.3

考え方を変えて、文と文の間に文章中には出現しないような区切り文字(デリミタ) を挿入し、その個数を数えてみたらいかがでしょう? センテンスの総数はデリミタの数+1になりますが。

noname#4564
noname#4564
回答No.2

たぶん、sentenceの数をカウントしたい、という意味でしょう。 文末に句読点がないケース、(文脈上は)文末ではないが、「.」や「?」があるケース、カギ括弧や引用符内の文字列の存在も考慮すると、正規表現を駆使しても非常に困難と思われます。

yoshio_special
質問者

補足

補足します。 nanashinogombeiさんが言われたように、sentenceの数をカウントしたいと思っています。 ただ、。だけでなく」で終わったり、?で終わったりしているので、難しくて困っております。

  • nightowl
  • ベストアンサー率44% (490/1101)
回答No.1

こんにちは。「文章数」という言葉の意味が少しつかみにくいのですが、 「文字数」のことでしょうか?もう少し具体的に補足をいただければ幸いです。

関連するQ&A

  • emacsでの文字化け

    お世話になります。 Linuxでemacsを使って日本語の文章の編集をしていたのですが、 あるときその文書を開いてみると突然文字化けしていました。 codingはどうもUTF8ぽいのですが、emacsで開くと文字化けして読むことができません。 geditやlessだとちゃんと読めますし、webブラウザでもちゃんと読めています(文字コードはUTF8で) どうやったらemacsで元通り読むことができるのでしょうか? linuxはFedoraCore6を使用しています。

  • Emacsが突如立ち上がらなくなってしまった。。。泣

    こんにちは。 私はVine Linuxを使用しているものですが、 この間、Vine3.0からVine3.1にアップグレードしたのですが、 その後からemacsが使えなくなってしまいました。 使用したコマンドは 「apt-get dist-upgrade」です。 毎回emacsを使おうとすると、 「Cannot open load file: /etc/emacs-21.3/site-start.d/53aspell-init.el」 と言う文章が出てくるのですが、 この意味が分かりません。 こういうコメントが出た時に どうすればまたemacsを使えるようになるのでしょうか? 詳しく教えて下さい。 PS: Linuxを使うくらいだから、 パソコンに相当精通している人間だと思われるかもしれませんが、 私はまだ大学生で 専攻もパソコンではありません。(物理科です) Linuxはレポート作成時に使用するくらいで、 Linuxに関する詳しい知識は持ち合わせていません。 そこで、出来るだけ平易な言葉で 説明いただけたら幸いです。

  • centosでmozc,emacs-mozc

    linuxのcentosでmozc,emacs-mozcをインストールしたいです。目的はsublime text 3 というエディタで日本語入力を行うため、SublimeMozcInputというパッケージをインストールしたいのですが、mozcとemacs-mozcが必要なようです。 SublimeMozcInputのホームページには、sudo yum install mozc emacs-mozcというコマンドを実行するよう記載されていますが、No package mozc availableと表示されてしまいます。 どなたか詳しい方法をご存知の方がいたら手順を教えていただきたいです。 よろしくお願い致します。

  • emacsで日本語入力する方法は?

    Red Hat linux7.0Jを使っています。 window表示モードにするとemacsで日本語が入力できますが テキストモードですと入力できません。 つまり白黒の画面にテキストでコマンドを入力するモードで emacsを立ち上げ、shift+spaceなどを押しても 日本語になりません。これは何かの設定が必要なのでしょうか? どこかのサイトに掲載されていた.emacsをコピーして入れてみました がまったくうまくいきません。初心者なのでよくわかりません。 どなたかお助けください。 お願いします。

  • emacs の色分けについて

    大学で使っているパソコンのemacsは、cプログラムを書くと、文によって色分けしてくれるのですが、 最近自機でもLinuxを入れてプログラミングをしているのですが、emacsに色を付けるやり方がわからなくて白黒です。。あと日本語入力もできません。。教えてください。

  • emacsとコンソールでのどっちつかずの文字化け

    linux初心者です。 少々ややこしい話なのですが、当初、OpenSUSE11がインストールされているコンピュータに、teratermでログインしてプログラムを作成していました。このときはエディタにはemacsを使っていました。emacs上での日本語表示、コンパイル実行後のコンソール上での日本語表示どちらも正しく日本語が表示されていました。 この後、linuxの勉強をしようと思って、OSにFedora8をインストールし、teraterm上から作成したソースをこちらのPCに移すと、実行後のコンソール画面で文字化けしました。これを直すためにコンソール画面の文字コードを変更してコンソールでの日本語が正しく表示されるように修正すると、今度はemacs上での日本語が文字化けしました。 多分、文字コードが合っていないためだと思うんですが、これを回避する方法をご存知の方はいないでしょうか? もし対処法をご存知の方が居られたら、教えていただきたく思います。よろしくお願いします。

  • emacs

    ubuntu8.10でemacsを使っているのですが、日本語の入力の際に直接入力ではなく一度囲みの中に日本語が入力されてから、emacs上にかかれます。どうしたらなおせるのでしょうか?

  • 秀丸をemacs(mule)のキーバインドで使うためのマクロはどこに?

    win98上で、秀丸(レジ登録済み)を使いたいのですが、これまで、win98上で mule for win32 を使っていたので、muleのキーバインドが実行できると嬉しいです。(例えば、ctrl-a で行頭とか、ctrl-bで一文字後退とか、そういうこと等。できれば、.emacs全部。) どこかにマクロが転がっていないでしょうか? このあたりに詳しくないのでさっぱり解りません。どうぞ教えてください。

  • Emacsで日本語の設定ができなくなりました

    MySQLの勉強をするため、Linux(vine linux4.2)を導入し、mysql-5.0.27インストールしました。MySQLの文字セットがUTF-8なので、EmacsのUTF8化について調べていたら、Emacs22は標準でUTF-8であることを知り、一旦元々入っていたEmacs21.4関係のものを全部消しました(rpm -eでの削除と残っていた.emacs等も)。そしてEmacs22(22.0.50.0.20060403vl2.i386.rpm)をインストールしました。Emacs22は立ち上がるのですが、<zenkaku-hankaku>is undefienedと表示されて、日本語が入力できません(Emacs21では大丈夫でした)。 どこを設定すればよいのでしょうか?.emacsを消したのはまずかったでしょうか?

  • emacs

    emacsで日本語入力や表示ができるようにするにはどうすればいいのでしょうか?