• 締切済み

言語解析について

大学で言語解析の研究をしているのですが、自由記述文の中から「○○より大きい」などの○○の数値とその数値に対してより大きいのか小さいのかという事を抽出したいのですが、何かよい方法はあるのでしょうか?

みんなの回答

  • nazotarou
  • ベストアンサー率46% (27/58)
回答No.3

フリーのテキストマイング(文節を分析してくれるもの)は幾つかありますよ。 私も興味を持ったばかりなので、詳しくは調べていないのですが、単語のカウントはできるようです・・・。 が、文章を理解するってわけでもないですので、数値云々は、さらなるプログラミング化が必要かと。 プログラムとしては、正規表現ですかねー。 テキストマイングは、NHKのがよさそうなんですが、有料なんですよねー。残念。

全文を見る
すると、全ての回答が全文表示されます。
  • kmee
  • ベストアンサー率55% (1857/3366)
回答No.2

あなたが研究しているのは、抽出したあとの処理なのでしょうか、抽出すること自体なのでしょうか? http://ja.wikipedia.org/wiki/%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A3%E6%9E%90 前者の研究なら、上にあるようなシステムで処理した結果を利用すればいいし、後者の研究なら現在がどんな手法が使われているかの参考になるはずです。 入力が単純なら正規表現でもよいですが、「自由記述文」となれば、検出精度が下ると思います。

全文を見る
すると、全ての回答が全文表示されます。
回答No.1

その文章がある法則であるなら正規表現によってパターンで検出できるけどそうでないなら 自分で構文解析と字句解析のエンジンを作るしかないでしょうね。 (日本語って構文解析と字句解析には不向きな言語だと思う。)

arakia
質問者

補足

回答ありがとうございます! 構文解析や字句解析のエンジンとはどのようにして作るものなのでしょうか? またどれくらいの時間と手間がかかるのでしょうか?

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • ゲノムの言語学的解析?ってありますか

    1月6日付け朝日新聞の新春対談で中村桂子さんが 「ゲノムには言語に似た文法があり、それを読み解くことが次のブレークスルーだと思っている」 と述べておられます。 これは配列の類似性比較や構造解析とは別の方法(たとえばコーパス言語学の手法)を言っておられと思うのですが、実際にどこかで研究されて居るのでしょうか。 少し違いますがロゼッタストーンの解読のようにゲノムを暗号に見立てて解読する ことは実際に行われているのか、とても興味があります。

  • 言語解析ライブラリ

    macOS9.1でシステム起動時に「言語解析ライブラリが見つかりません」というエラーがでてしまい、日本語入力ができなくなりました。「言語解析ライブラリ」を復活させる方法はありますか?OSを再インストールするのは、避けたいのですが・・・

    • 締切済み
    • Mac
  • pascal言語

    pascal言語のプログラミングについて質問があります。 repeat文やwhile文を用いて数値を入力するとき、その文の中で入力された数値を比較して最大値や最小値を出す方法が分かりません。数値の比較ですと配列以外に思い浮かばないのですが、配列を用いない場合どのようにすれば良いのでしょうか? よろしくお願いします。

  • 言語処理系とは何ですか?

    現在大学二年生です。 C言語のプログラミングが好きで昨年から独学で色々な本を読んでいます。 大学院でも是非ともC言語を生かすような研究をしたいと思っているのですが、色々な大学のホームページを調べてみると教官に分野についてプログラミング言語及び言語処理系といった記述をよく見かけます。 この言語処理系とは一体どのような分野なのでしょうか? またC言語を生かす、あるいは学ぶにはどのような分野の研究に進むのが最適でしょうか? 自分は高校の時にはVBもやっていたしCに限らず言語に興味があります。

  • perlでhtml 解析

    perlでhtmlを解析して、ほしい情報を抽出したいのですが、 タグで囲まれたテキスト情報を抽出できるものは多くありますが タグの中の情報を取得できるモジュールや方法はありますか? たとえば html内の  <a href="******" onclick="return opendetail(******);"> のなかの********を抽出をしたいです。

    • ベストアンサー
    • HTML
  • 数値解析、数式処理のソフトウェア開発の仕事

    大学生学部生です。数値解析ソフトウェアにかかわることがあり興味を抱きました。こういうソフトウェアの開発を仕事にできたらいいなぁと思ったのですが、ANSYS、ABAQUSなどの有名どころはほとんどアメリカやヨーロッパの企業によって作られているように思います。 解析そのものよりも、それを支える数値計算に特に興味を持っています。なので、ソフトウェアサポートではなく、数値計算そのものの開発に携わりたいと考えているのですが、こういう仕事は日本でも可能でしょうか。 おそらく、上記のような会社ではサポートなどを各国で、ソフトウェアの開発自体は本国で行っていると思います。キャリアパスを考えると、日本の大学院を卒業し日本の支社に就職するのと、留学し現地で採用されるよう頑張る方がいいのでしょうか。 また、要求される学歴・スキルなどはありますか。海外ではドクターを持っていない限り補助的な仕事しかできないという噂を聞いたのですが本当でしょうか。言語はFortran95を学び始めたのですが、他に準備できることがあればお願いします。 大学では全く関係ない研究室に所属しているので、大学院では違う研究室に転属しようと思っています。こういった研究ができる研究室(国内外問わず)はどのようなところがありますか。 その他、業界での競争の厳しさ、将来性、雇用状況などについてもご存じの方がいらしたら一言お願いします。

  • ミトコンドリアDNAの抽出・解析方法

    今、ミトコンドリアDNAについて調べています。 そこで疑問に思った事なのですが、ミトコンドリアDNAはどのようにして抽出されるのでしょうか? ミトコンドリアは細胞の中に数多く存在していますが、その一つ一つからDNAを抽出する方法は具体的にどうなっているのでしょう?核のDNAと何か違う点もありますか?そして取り出したDNAをPCR法で増幅させ、解析装置にかけるんですよね?一体どのような解析をするのですか?これも核のDNAと違うところはありますか? 分からないことだらけですが、教えてください。

  • 音を扱うことに適したプログラミング言語

    音を読み込み、データ化、解析等を卒業研究でしようと考えています。このような内容をプログラミングで行うのですが、それに適したプログラミング言語を考えているのですが、適したプログラミング言語またはそれぞれの言語の利点・欠点などを教えていただきたいです。 よろしくお願いします。

  • SQLの解析資料の作り方

    仕事のメンテナンスで他の人が作ったSQLの解析を 多く行うのですが、複雑なSQLや10以上のテーブルを 結合して何をどうしているかを、解析した以外の人間が 一目で見て分かるような資料をどのように作ったらいいか 困っています。 何か良い表現方法やまとめかたをご存知の方がいらっしゃったら 教えていただきたいです。 現在は、どのテーブルからどの結合条件でどの抽出条件で などのまとめかたで記述をしているのですが、ぱっと見 わかりづらく、伝わりにくいので解析後時間がたってしまうと わけがわからなくなり困っております。 よろしくお願いいたします。

  • 画像解析の手法について

    僕は今大学の3年生です(ちなみに工学部の情報系です)。将来的には画像解析をする(例えば指紋や網膜など)機能を利用したセキュリティや本人認証などそういった機能を研究をしたり、利用した会社に入ってみたいのですが、今の段階で学んでおけばよいこと(読むべき本)があればぜひ教えてください。 ちなみに今プログラミングでC、JAVAを学んでいますがこれらの言語をつかって画像解析はできるのでしょうか? 是非とも皆さんの知っていることを教えてください、おねがいします。