• ベストアンサー

単語のソート・集計をしたいのですが…

「この人の作詞にはこの単語が多い」 というようなことを調べたいと思い、 テキストファイルに歌詞を入力して単語ごとに区切り、 入力した単語をソートして、 同じ単語の数が多い順に上から並べるというようなことを どうにかソフトを使ってできないか考えてみたのですが、 思いつきません。。 このような目的に適したソフトを ご存じの方がいらっしゃいましたら 教えていただけませんでしょうか。 よろしくお願いします。 結果はそれほど精密でなくても よいので、何か方法はありませんでしょうか。。

質問者が選んだベストアンサー

  • ベストアンサー
  • 12345963
  • ベストアンサー率55% (11/20)
回答No.3

配布先 http://khc.sourceforge.net/ 上だとちょっとわかりにくいので、こんな感じっていうレビュー http://taffy632.blog24.fc2.com/blog-entry-275.html 多分、要望のまんまのソフトだと思います。 不服の場合は「テキストマイニング」で調べると、他のソフトも出てくると思います。

analogy
質問者

お礼

こんな便利なソフトがあるんですね。 早速使ってみます。ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.2

エエクセルやアクセスでできますよ。 フリーならOpenOfficeですね。 http://www.forest.impress.co.jp/lib/offc/document/offcsuite/openoffice.html

analogy
質問者

補足

回答ありがとうございます。 ただ歌詞を分割するのは自分でやるとして、それをセルに入力するのが面倒だと思ったのでエクセルは敬遠していました。すみません。。

全文を見る
すると、全ての回答が全文表示されます。
  • koko_u_
  • ベストアンサー率18% (459/2509)
回答No.1

日本語の場合、「単語に分ける」所が非常に難しい。 茶筌などを使うしかないと思う。 分割できれば、集計は Excel でも何でも良いだろう。

参考URL:
http://chasen-legacy.sourceforge.jp/
analogy
質問者

お礼

ありがとうございます。分割するソフトがあるんですね。。 エクセルは思いついたのですが、セルに入力していくのが面倒で… どうもありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • テキストファイルを読み込んでソートするプログラム

    英文のテキストファイルを読み込んで、単語を一行に一単語ずつ並べた後、それをアルファベット順にソートして、同じ単語を消去したテキストファイルを作るプログラミングを作りたいと思っています。 しかしテキストファイルを読み込むという命令がよくわかりません。 isalpha()などを使ってプログラム内に打ち込んだ英文を単語ごとに分けるプログラムは出来たのですが、テキストファイル(.txt)はどうやって読み込めばいいんでしょうか? プログラムはGNOMEのXEmacsで作っていて、C言語です。

  • VisualBasic2008でファイルから指定文字数の単語だけ抜き出したい

    VisualBasic2008でファイルから指定文字数の単語だけ抜き出したい場合にはどのようにすればいいのでしょうか? 読み込むファイルはテキストファイルで単語ごとに改行してあります。 完成のイメージとしては、ファイルの上から順に読み込んで行き、ボタンを押すごとに指定文字数の単語をテキストボックスに表示させていくという処理を考えています。 どなたかご教授願えないでしょうか?

  • 文字数順にソートするには

    テキストファイルの行を文字数順にソートしたいのですが、 sort コマンドを使って行うことはできないのでしょうか? $ perl -e 'print for sort { length $a <=> length $b } <>' foo.txt でもいいのですが、行数が膨大なため、できるだけ早く処理したいと思っています。 もし何か方法がありましたら教えてください。お願いします。

  • テキストフィルの行の文字数順にソートしたいのですが・・・

    テキストファイルの行単位での文字数が多い順や少ない順に ソートして並べ替えしたいのですが、その様なフリーソフトってないでしょうか? ベクターなども、見たのですが、Aからとかの昇り順と降り順しかないので・・・ もしかしたら見落としかもしれません・・・ -------------------------- honey shanshanmeimei loverzday artfree tfsq 上記の物を下記にしたいのです。 -------------------------- shanshanmeimei loverzday artfree honey tfsq -------------------------- この様に、文字数が多い順に並べ替えをしたいのです。 出来れば、少ない順も出来るソフトもあれば良いのですが・・・ よろしくお願いいたします。

  • 月名でソートを行いたいのですが・・・

    Solaris8上で、ソートコマンド『sort -M 入力ファイル名』をやったのですが、上手く月名でソートを行ってくれません。入力ファイルは、月名のみのレコードが書かれたテキストファイルです。以下に、私が入力した月名を示します。 JAN、FEB、MAR、APR、MAY、JUN、 JUL、AUG、SEP、OCT、NOV、DEC もう一点、同一レコードを削除する『-u』オプションも上手く動きません。 どなたかご存知でしたら教えて頂けませんか? 宜しくお願い致します。

  • sortコマンドについて

    ファイルaaaについて、 第1ソートキーを第1列目で数値順に 第2ソートキーを第2列目でアルファベット順に ソートした結果をbbbに出力したいと思います。 sort -n -k 1,1 -d -k 2,2 aaa > bbb としたところ、正しい結果が得られませんでした。 どのようにしたら良いのか教えて下さい。

  • 多項目のソート

    現在Excelを使っているのですが 複数項目のソート(列1を最優先、列2を2番目に優先、列3を3番目に)はあるのですが 3項目までしか設定ができなくて困っております。 これ以上の数をソートできて、尚且つ優先順を設定できるソフト・ツールはないでしょうか? ご存知の方がいらっしゃいましたら宜しくお願い致します。 フリーウェアでお願いします。

  • Access テキストデータのソートについて

    Accessでのテキストデータのソートの仕様で悩んでます。 例を挙げると・・・ テキスト型のフィールドに対し以下のようなデータを入力します。 フィールド1 9-1 9-001 9-0001 90-1 90-001 900-1 900-11 9000-1 9001-1 90000-1 ここでフィールド1を昇順でソートをすると 90000-1 9-0001 90-001 9000-1 9-001 900-1 900-11 9001-1 90-1 9-1 という順になってしまい、並び方に一貫性が無いように思えます。 なぜこのような並びになってしまうのか? お判りになられる方、いらっしゃいませんか??

  • Sortコマンド以外で行をソートする方法

    Sortコマンドを使ってテキストファイル内の行をソートしていたのですが、扱うテキストファイルの内容によってエラーが出てしまい、エラーメッセージをWEBで検索して書かれていた対策をしたのですがうまく行きませんでした。 ですので、Sort以外のコマンドで、テキストファイル内の行を昇順と降順でソートしたいと考えているのですが、何か方法はないでしょうか。 Windowsのコマンドプロンプトで使用出来るものであれば、AWKでもPerlでもその他のコマンドでも構いませんし、スクリプトファイルを読み込めるコマンドでしたらスクリプトでの書き方でも結構ですので、ご存知の方がおられましたら教えて頂けないでしょうか。

  • 数字を認識するsortコマンドはありますか?

    Windows XP/7のファイルマネージャーを見ていると、桁数に関係なく数字がソートされています。 (昔は桁数をそろえてゼロ詰めしていたものでしたが) これと同じことができるsortコマンドはないでしょうか? ファイル1 ファイル2  : ファイル10 ファイル11 というような内容のテキストファイルをソートして、数字順に出力してほしいのです。 現状では ファイル1 ファイル10 ファイル11 ファイル2  : となってしまいます。

このQ&Aのポイント
  • ESET PARENTAL CONTROLを使用していたが、機種変更後にダウンロードできない。どうすればいい?
  • ESET PARENTAL CONTROLを購入し、使用していたが、スマホの機種変更後にソフトが見つからない。ダウンロード方法を教えてほしい。
  • スマホの機種変更をしたが、ESET PARENTAL CONTROLをダウンロードできない。どのようにすれば良いのか教えてほしい。
回答を見る

専門家に質問してみよう