• 締切済み

自然言語処理のための学習用のデータセット

自然言語処理のための学習用のデータセットを探しています。データを無理でダウンロードと使用できるサイトがあれば教えてください。

みんなの回答

回答No.1

参考URLの記事をご覧ください。「自然言語処理に使えるデータセットベスト25」というまとめ記事です。

参考URL:
https://gengo.ai/ja/datasets/the-best-25-datasets-for-natural-language-processing/

関連するQ&A

  • 自然言語処理についての文献

    自然言語処理をするのに参考になる文献が知りたいです。 大学時代に多変量解析等の勉強はしていますが、 自然言語処理はあまりなじみがありません。 学習するに当たり良い教材がありましたら、教えてください。

  • 自然言語処理

    私は、自然言語処理を専攻する学生です。 現在、この分野はとても注目されていると聞きます。 そこで、この分野が活かせる企業があれば教えてください。 残念ながら私はまだ学部レベルですが、 高専で自然言語処理の研究を独学でやり、学会発表、 学内選抜に選ばれた経験があるので、少し自信はあります。 今のところ、 ポータルサイト:Google,Yahoo… 印刷業界:大日本、凸版… だけです。。。

  • 私は自然言語処理に興味を持つものです

    私は自然言語処理に興味を持つものです  言葉は樹形図に表すことができると思うんですよ(実際自然言語処理関係の本を読むと見かけますが)  たとえば  色→→青   ↓→赤   ↓→etc  こんな感じですか。  日本語全てをこういう感じのカテゴリーに分けて樹形図にしているのを紹介しているサイトを探しています。知っている方教えてください><自力ではまだ見つけれませんでしたし、どう検索してよいかいまいちよく分かりません  ちなみに自分では 言語 樹形図 などで検索してみましたがヒットしませんでした・・・。  もしや無いのでしょうか?  知っている方教えてください><

  • 言い換えエンジンKURA・自然言語処理

    私は自然言語処理に興味がある素人です。以前、言い換えエンジンkuraをインストールしたくてソフトのインストールの仕方について質問しました。私はOSをubuntu LINUXに切替え、ある程度ソフトのインストールに成功しましたが、何故かLilfesと言うソフトをインストールすことがかなわず、後一歩というところで言い換えエンジンKURAをインストールすることがかないませんでした。しかし私はここで諦めるつもりはありません.なんとしてでもこの言い換えエンジンKURAをインストールしたいのです。しかし、手始めに何を学べば良いのかいまいちよくわかりません。プログラミングを学びたいのですが、言語は何が良いのか?その言語は自然言語処理に適しているのか。そもそもプログラミングの基礎とは何なのか?どうか教えてください、お願いします。

  • 本文で出てきたんですが、「自然言語」って何ですか?

    「情報が氾濫し、人々が混乱する中、情報処理機械としてのコンピューターの発展にともなって、情報が効率化され秩序化されるが、自然言語による情報の交換過程では決して楽観論だけが支配的的ではない。」 という文脈なのですが、文中に出てくる「自然言語」ってどのような意味でしょうか?評論の用語でしょうか?

  • アメリカで自然言語処理に強い大学、また有名な教授

    今情報工学科の3年に在学しています。大学卒業後はアメリカの大学院に進学しようと考えていますが、自然言語処理について学びたいのですが、どの大学のどこの研究室がいいのかよくわかりません。 大学院選びは教授で選べと多数の人から聞いておりますが、その人の人間性は会ってみないとわからないので、それ以外のファクターで決める場合はやはり、勉強したい分野で有名な教授や、活気のある研究室を選ぶべきと本で読みました。 みなさん自然言語処理(人工知能ともかぶると思います。)の分野においてどこか活気のある研究室または有名な教授などを知っていいたら教えていただけませんか? よろしくお願いします。

  • 言語処理って?

    どのカテゴリーに属するかわからないので ここにしてみました。 人の言語処理の過程とはどのようなもの なのでしょうか? それらがわかるようなHPがあればサイトを 教えていただけないでしょうか。

  • BP学習に使う学習データについて

    ここ http://mars.elcom.nitech.ac.jp/java-cai/neuro/menu.html を参考にニューラルネットワークのBP学習のプログラムを作成しているのですが、 学習データについて疑問があります。 学習に使用する学習データをプログラムでは乱数を生成して作っている のですが、学習データの生成に際して、データの分散や平均の大きさを 考えるべきなのでしょうか? また考えるべきだとしたら、どのように評価したらよいのでしょうか?

  • 自然言語処理の研究のやり方について

    私は、ある私立理系大学院情報系の修士1年生(男)です。 自然言語処理という分野を研究しています。 学部時代には、いろいろと研究しているつもりではいましたが、 何度も白紙になり、結局のところうまくいかず、無理やり卒論を完成させて卒業をしたようになってしまいました。 これをバネに、大学院ではしっかりとした研究をしたいと考えています。 しかし、やはり要領が悪いのか、分析らしきものをしているときにも余計にいろいろと考えて、あちこちに手が回り、わけがわからなくなっています。 担当教授にも、相談しているのですが、全くその都度言っていることがコロコロと変わって何をしていいのか定まりません。 そういうことがもう半年も続き、結果だけいえば、何も進んでいないと同じ状況になってしまっています。 モチベーションも下がりつつあります。 抽象的な文章で申し訳ありませんが、研究のやり方、モチベーションの上げ方についてアドバイスをいただけたらと思います。 どうかよろしくお願いします。

  • C言語学習の始め方

    本当に初歩的な質問で申し訳ないのですが、どうか教えてください。 これから独習でプログラミングを始めようとしている、まったくの初心者です。 それで、C言語から入りたいのですが、「始め方」が良く分かりません。リファレンス本なども何種類か見てみたのですが、どの本も、「main{}・・・から初めて・・」のように、いきなりプログラミングの説明から始まっています。 具体的な質問としましては、 1.window2000を使用しているのですが、C言語を学習するためにはC言語ベースのosを新たにインストールしなくてはいけないのか。あるいは、その方が学習しやすいのか。 2.学習する環境をつくるためには、どのようなモノ(ソフト)が必要なのか。 ・・・などです。 どうぞよろしくお願いします。