• 締切済み

データマイニングに有効なAPI

講義でマイニングのレポート課題が出されたため、 APIを用いてサンプルを集めようとしているのですが、 詰まってしまいました。 というのも返されるデータが少なすぎたり、 実行回数に制限がかかっていたりして、 なかなか大量のデータを集めることができないためです。 はてなや、twitterのを用いてやってみようとしたのですが 過去の記事を持ってくることがうまくできなくて困ってしまいました。 そこまで大きなものをやろうと思っているわけではないので、 1000件くらいのサンプルを安定して集めたいのですが、 何か良いAPIはないでしょうか? 学習の段階がまだ不十分で、API自体が有効なのかどうかも良くわかっていないため、 そういったところも教えていただけると助かります。

みんなの回答

  • gadd3
  • ベストアンサー率46% (211/451)
回答No.1

何のデータのマイニングなのでしょうか? 販売系? 金融系? 会計など? それとも「何でもいい」? 私はAPIを使ったことがありませんので他の識者の方に引き続き聞いて欲しいのですが、簡単なマイニング(?)ならExcelのピボットテーブルとかでもできるので、Excelの分析系の書籍などにおまけでサンプルのリストデータなどがよく載っていますが・・・。 100件程度のデータサンプルが多いと思いますので、加工して100件程度にすればよいのではないでしょうか? 「APIを使わないとだめ」というマイニングならダメですけど・・・。

nemu0806
質問者

お礼

ご回答ありがとうございます。 マイニングするデータは特に指定されませんでした。 そのため、ブログに書かれている記事の内容や登録タグを持ってきてよくセットで使われているものを発見するものや、 月日の経過である単語の頻出度がどう変化しているか などを見つけるものをやってみようかなと考えています。 サンプルデータの件ですが、自分で収集または作成することが指定されているので私はAPIを用いて集めようと思っています。(書籍についてきたサンプルデータを加工すればその条件を満たすかどうかはちょっと自信がないです) またExcelの使用は禁止されていたので、JavaScriptでマイニングするものを作ろうと思っています。

関連するQ&A

  • TwitterのAPI制限について

    OAuthを使ってログインしたいと思い色々調べているのですが APIの実行回数の制限についてよく分かりません。 例えば下記のコードでログイン用のURLを取得しています。 TwitterのAPIの制限が1時間に150回となっているのですが 下記のログインURL呼び出しのリクエストはAPI実行回数制限にカウントされるのか? カウントされるのであれば サーバーIP等での実行回数制限になるのか クライアントIP等での実行回数制限になるのか どちらなのでしょうか? サーバーIPでの制限であればまともにサービス展開できませんし 調べてみたのですが確認できませんでした。 ご存知の方がいらっしゃいましたらご教授下さい。 よろしくお願いします。 <? session_start(); require_once("oauth/twitteroauth/twitteroauth.php"); if($_SESSION['oauth_token']===NULL && $_SESSION['oauth_token_secret']===NULL){ $consumer_key = "xxxxxxxxxxxxxxxxxxxxxx"; $consumer_secret = "xxxxxxxxxxxxxxxxxxxxxx"; // OAuthオブジェクト生成 $to = new TwitterOAuth($consumer_key,$consumer_secret); // callbackURLを指定してRequest tokenを取得 $tok = $to->getRequestToken("http://xxxxxxxxx/callback.php"); // セッションに保存 $_SESSION['request_token']=$token=$tok['oauth_token']; $_SESSION['request_token_secret'] = $tok['oauth_token_secret']; // サインインするためのURLを取得 $url = $to->getAuthorizeURL($token); print "<a href=\"$url\">サインイン</a>"; } else{ //サインインしていればヘッダーを出力 include("user_header.php"); } ?>

    • ベストアンサー
    • PHP
  • ツイッター(Twitter)のホワイトリスト(利用回数緩和)に登録され

    ツイッター(Twitter)のホワイトリスト(利用回数緩和)に登録されているか確認したいです。 ツイッターのタイムラインをAPIを使ってOAuth認証で取得していますが回数制限が有るらしいのでホワイトリストという制限回数を増やす申請をしましたが10日経っても返事がないのです。 メールの見落としも有るかもしれませんが、今現在ホワイトリストに登録されているかどうかを知る方法はないのでしょうか? 宜しくお願いします。

  • Google AJAX Feed APIのカスタマイズができなくて困ってます。

    Google AJAX Feed APIを用いてウェブサイトの新着情報欄に 他のブログの記事を読み込ませたいと思っております。 下記のサイトを参考にして http://blog.fkoji.com/2007/04190018.html ブログ記事のタイトルだけ読み込ませることが できるようになりましたが、さらにカスタマイズをしたいと思ってます。 具体的には、 ・タイトル文字数を常に12文字だけ表示に制限したい。 ・タイトル文字の後に...を表示したい。  例:今日は良い天気で桜が満開... 自分はJavascriptをいじってカスタマイズすることができず、 サンプルを探していたのですが、見つからなくて困ってます。 よろしくお願いします。

  • Twitterがたまに読み込めなくなります

    iPhoneでTwitterをしてるとたまに読み込めなかったりツイートできなかったりします。 ツイートできなかったときはツイートできませんでしたと出て再投稿か下書きに保存かの選択肢が出ます。 アプリの再起動をすれば治るのですが毎回再起動もめんどくさいです。 iPodでTwitterをしてるときだけは問題なくつかえてます。 iPhoneはこの前新しく6sを買ってiPodのデータから復元して使いましたがTwitterはやっぱりたまに読み込めないことが多いです。 api制限というものでしょうか? api制限はアプリの再起動をするだけで直るものですか? 1年くらい前から起こっていてiPhone2台ともこれなので少し困ってます。 なぜiPodだけは問題なく使えるのでしょうか? iPodからデータ移行したiPhoneではダメでした。

  • WEB上でのやりとり

    地域コミュで講義を行うことになりました。 下記の条件に当てはまるようなソフトやスクリプトを教えてください。 (1)管理者対多数(100名ぐらい)のやり取り (2)多数を個別に管理 (3)管理者から多数全員に対して同一の課題を投稿(記事としての扱いでもOK) (4)多数から課題に対するレポートを投稿(コメントとしての扱いでもOK) (5)多数から個別のレポート内容は、管理者のみ閲覧可能 (6)管理者からレポートの評価の投稿(返信扱いでもOK、但し閲覧はレポート提出者のみ可) CGIやPHPのブログ用のスクリプトで探しましたが見つかりませんでした。 閲覧制限を登録者ごとに設定できればブログでも可能だとおもうのですが、 なかなか適当なものがありませんでした。 大学などのレポート提出のシステムに近いかとおもいます。 よろしくお願いいたします。

  • 経済学のレポート課題のための新聞記事

    大学一年生の一人暮らしで新聞は購買していないのですが、学校で経済学のレポート課題が、気になった経済記事をひとつ取り上げて、それについてのレポートを作成せよ。というものでした。そこで質問なのですが、この場合やはり新聞は購買したほうがよいでしょうか? またその場合内容が経済となるとやはり日経新聞が良いのでしょうか? またレポート作成自体も経験がないのですが、この課題ですと、どのような記事が題材として取り上げやすいでしょうか? 現段階では何をしていいのやらさっぱりです。とっかっかりと言いますか、ヒントになるようなことだけでも、アドバイスしていただければ幸いです。

  • 大学の授業(講義)と単位とは

    大学の仕組みなどについて色々勉強していました。 その中でお聞きしたいことがあったので質問させてください 単位を取るには例えば、英語を●時間受けてテストを受けて合格して単位がもらえるのですね 英語を一時間(大学で言うと一コマというのですね?)受けて一単位なのかなと思っていましたが そうではなく例えば英語を一コマだけ受けるのではなく決まった回数授業(講義)を受けて決まった回数授業を受けたらそこで初めてテストを受ける権利が生まれ、テストを受けて合格すれば単位がもらえるということなのですね? 得意な教科、講義だけを受けることはできないく、絶対にこの教科(講義)だけは受けないといけないというものもあり、その絶対に受けないといけない教科(講義)を決まった回数受けてテストを受けて合格して単位取得となるのですね あとはレポートとか、課題とか、やらないといけないこともやってすべてが終わったときに単位をもらえるという形もあるのですね すみません、大学の授業(講義)について自分なりにですが調べました。 もし間違っていたり、何かご指摘などあればお願いします。

  • JSON形式のデータ解析が出来なくて悩んでます。

    「Twitterから学ぶ,Web APIのキホン」(http://gihyo.jp/dev/serial/01/perl-hackers-hub/000403)のサンプルプログラムを参考にitunesの検索apiの検索結果を解析しようとしているのですが解析できなく、何も表示されない状態になります。 itunes 検索api http://www.apple.com/itunes/affiliates/resources/documentation/itunes-store-web-service-search-api.html まずは上のSearch Examplesにいくつか示しているitunes apiの検索結果(jsonデータ)から"artistId"に対する項目や"artistName"に対する項目を抜き出そうと試みています。 以下は実際に私が実行しているプログラムです。 ----------------------------------------------------------------- print <<"HTML"; Content-type: text/html <html> HTML use LWP::UserAgent; use URI; use JSON qw(decode_json); use Encode qw(encode_utf8); my $uri = URI->new('※ここにitunes apiの検索結果のurl入れています'); my $ua = LWP::UserAgent->new; my $res = $ua->get($uri); my $json = $res->content; my $ref = decode_json($json); for my $applist ( @{ $ref->{results} } ) { print encode_utf8("$applist->{artistId}: $applist->{artistName}\n");} -------------------------------------------------------------------------------------- としているのですが結果は何も表示されません。※cgiはmac 環境にてUTF-8 Mac(CR)で保存しております。 「Twitterから学ぶ,Web APIのキホン」のサンプルプログラムは正常に動いて表示出来ているのでモジュールやPerlのパスには問題ないと思います。 どうすればitunes 検索apiのjsonデータがPerlでちゃんと解析されるのかご教示お願いします。

    • ベストアンサー
    • Perl
  • 事前学習レポートについて

    希望していた大学への進学が決まった高校3年生です。 大学から、入学までの事前学習として指定課題図書を読み、大学で何を学びたいかについて、2000字以内のレポートを書くようにとの指示を受けたました。ですが、今までレポートを作成した経験もないため、書き方が分からず困っています。 指定課題図書は、進学する学科の分野に関して幅広く扱った、入門者向けの論文集でした。かねてより興味を持っていたテーマがあったので、私は課題図書を読んだ後、そこに読書案内や参考文献としてあがっていた本を何冊か読みました。 しかしいざ書くという段階になると、志望理由書のように何に興味があるのか自分の意見を書くのか、あるいは、学びたい内容について調べたことを書いた上で、そのことへの疑問点をあげるような形でまとめればいいのか分からなくなってしまいました。 (レポートの書き方について書かれたサイト記事などを参照すると後者の方かな、とは思うのですが・・・) レポートの書式についての指定は無く「書式自由」となっているのですが、やはり表紙などはつけるべきでしょうか? また、表紙や見出しの文字は字数として数えられるのでしょうか? 長々とすみませんでした。 本当に困っているので、ぜひアドバイスをお願いします。                            

  • 心理学レポートの書き方について

    心理学レポートの書き方について 大学の心理学の講義で「日常生活の考察に基づき自身のパーソナリティや対人コミュニケーションについて第三者の観点から客観的に分析を行う」というレポート課題が出ました しかし、自分の目線では自分のことは書けますが、第三者の目線となると・・・・どうやって書きだしていったらわかりません。どなたかアドバイスをしていただければ幸いです。授業ではパーソナリティ(自己概念について、性格類型論、性格特性論、心理アセスメント)や対人コミュニケーション(対人魅力、葛藤、段階理論)については一通り学習しましたし、YG性格検査も授業で行いました。 よろしくおねがいいたします。