• ベストアンサー

Rails 指定Webページの情報取得方法

Ruby on Railsで「はてなブックマーク(http://b.hatena.ne.jp/)」のように、 URLを入力すると、ページタイトル、ページ内容、ページ画像 を取得する方法をご教授お願いします。 参考URL,参考ソースコード(Github等)があれば助かります。

質問者が選んだベストアンサー

  • ベストアンサー
  • notnot
  • ベストアンサー率47% (4856/10272)
回答No.1

ページのHTMLを取得した後、HTMLを解析するツールで情報を切り出します。 切り出しの指定方法は、CSS風とxpathと2通りありますが、xpathが細かい指定ができるので良いと思います。細かい指定をしないのならCSS風が楽か。 ツールとしては、標準添付だとREXML(Rubyで書かれている)。gemだとNokogiri(Cで書かれている)。 いずれもウェブ上にドキュメントがあります。

Bellick
質問者

お礼

ご回答ありがとうございます。 Nokogiriを使用してみたいと思います。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • Webで取得できる情報

    Q1.「サイトA」から「自分のサイト」にアクセスされた時に、 リンク元である「サイトAのタイトル」を取得することはできますか? Q2.「サイトA」から「自分のサイト」にアクセスされた時に、 何というキーワードのリンクからアクセスされたか、そのキーワードを 取得することはできますか?例えば、「面白ページ」というキーワードの リンクをクリックしたら自分のページにアクセスされた。その時に、 あなたは面白ページというキーワードでアクセスしましたね、みたいな ことを表示したいのです。 Q3.自分のサイトとは別のサーバーに置いてあるファイルのサイズ情報を 取得することはできますか?例えば、ファイルのURLを入力すると、 そのファイルサイズを調べてきてくれて表示してくれるようなこと。 ※方法のヒント、サンプル、又は参考になるページを教えてください。 よろしくお願いします。

    • ベストアンサー
    • HTML
  • ruby on railsでDataBaseのデータを取得するには?

    おっす。 いま会社でLinuxのubuntuを使っています。 そして「ruby on rails」を使ってwebアプリケーションを作っています。 が!! うまくいきません。 今やろうとしていることは、管理者ページで登録した社員情報をデータベース(mysql)に保存して、今作成しているトップページに社員名などを表示させるというものです。 上司は、ActiveRecordを使ってデータベースのデータを取得して、そのデータをrhtmlで使えば表示できるといっていますが、今のところ全くうまくいきません。 社員情報は名前・住所・年齢など様々な個人情報を入力していますが、トップページに表示させるのはこの中の名前だけです。 今回の質問としては、データベースから個別にデータを取得して表示させることができるのか?ということです。 また、ActiveRecordを詳しく紹介しているサイトを知っていましたら是非教えてください。

  • Rubyでwebページを取得するとき

    Rubyでwebページを取得してtxtファイルに出力したいと考えています。 URLリストを別ファイルで用意して、それを片っ端から読み込んで表示させるものです。 require 'open-uri' require 'kconv' while url=gets next if url=="\n" page=URI(url).read page=Kconv.tosjis(page) puts(page) end これで成功するのですが、「URLリストにのっているwebページが見つからなかったら飛ばして次のページを取得しにいく」ことを追加したいです。 どう書けばいいでしょうか? 教えていただければ幸いです。 よろしくお願いします。

    • ベストアンサー
    • Ruby
  • ウェブページスクラップやブックマーク

    ウェブページを保存していくときに、ブラウザのお気に入りでは収拾がつかなくなって、ここ最近右往左往しています。 googleブックマークとかもやってみたけど… 家以外のパソコンでもネットを使う機会が多いので、とりあえずウェブ上に保存できる「はてなブックマーク」で気になるウェブページを保存している状態です。 ただ、はてなブックマークは検索が弱いのが難点かなと思います(タイトルやタグだけでなく、ブックマークしたサイトの中身も検索できれば最高なんですが。元々がブックマークで、スクラップ用に作られてないからですかね)。 一元化して保存していけるようなものがあれば、ぜひ紹介してください。 ・検索がしっかりしている(保存したページの中身も検索できる) ・パソコンが変わっても使える(ポータブルHDDは持っています) ・タグ付けなどができる(「サッカー」、「webservice」など) ・時系列かタグ(フォルダ)ごとに分けられる ・保存が簡単(3クリック以内) はてなブックマークで検索が強化されるか、紙copiをはてなブックマークと同期させて保存させていければいいのでしょうが、今あるソフトでなんとかできればいいかなと思います。 あと、ポータブルHDDにインストールした紙copiって使えるんでしょうか?HDDを挿すパソコンを変えて、絶対パスが変わっても使えるのかなと。

  • Railsで、最終更新レコードを取得するには?

    Ruby on Rails 4.1.2 を学習しています。 [1] pry(main)> Entry.all Entry Load (0.1ms) SELECT "entries".* FROM "entries" +----+--------+--------------+---------------------------+ | id | name | comment | updated_at | +----+--------+--------------+---------------------------+ | 1 | Taro | 楽しみです | 2014-09-16 20:00:00 +0900 | | 2 | Jiro | わくわく | 2014-09-16 20:20:00 +0900 | | 3 | Saburo | 頑張ります | 2014-09-16 20:10:00 +0900 | +----+--------+--------------+---------------------------+ Entryモデル(テーブル)で、最後に更新したレコードを取得するにはどのようにしたら良いでしょうか? 最終更新日が2014-09-16 20:20となっているid=2のレコードを取得したいのです。 Entry.find(2)とすれば、もちろん取得できるのですが、それではあんまりですし。 よい方法を教えて頂けないでしょうか? どうぞよろしくお願いいたします。

    • ベストアンサー
    • Ruby
  • ruby on Railsについて

    今度新しい仕事につきます。 そこで使用されているのはruby on Railsだそうです。 ruby on Railsやrubyのことは全くわかりません。 プログラムの経験はphpをかじった程度です。 これから猛勉強をして習得しようと考えています。 そこで質問が3つほどあります。 1.ruby on Rails を勉強するにあたり、rubyの勉強もしないといけないのか。 また、rubyの勉強をしなければいけない場合、rubyとRailsどちらを先に勉強するべきか。 2.なにかよい参考書はあるか。 3.よい勉強方法はあるか お忙しいとは思いますが、ご回答よろしくおねがいします。

    • ベストアンサー
    • Ruby
  • URLからそのページのタイトルを取得したい

    こんばんは。 任意のURL(例:http://okwave.jp/)から、そのページのタイトルを取得したいのですが、どのようにすれば良いでしょうか。 なるべく簡単な方法をお願いします。 ちなみに http://okwave.jp/qa1965843.html のソースではうまくいきませんでした。 それでは、よろしくお願いします。

    • ベストアンサー
    • PHP
  • Ruby と Railsのバージョン

    Ruby on Railsを始めることになりそうで、色々調べているのですが、 今まで全く使ったことがないのでアドバイスの方よろしいでしょうか。 参考書など検索するとRails1.2が多くRails2.0には対応していない等の 文言を見かけるのですが、現時点でRuby on Rails初心者としたらどの バージョンを使うとよいでしょうか。 一般的なアドバイス等頂けますと助かります。 よろしくお願いします。

  • レンサバでにて、JRails3動かしたい。

    レンサバでにて、JRails3動かしたい。 タイトル:Ruby ○ バージョン1.8.5 ー>Ruby1.9.2 と Rails3にするには? 緊急度:急ぎ 本文: 引用元URL: http://hamasyou.com/blog/archives/000369 Ruby の環境を切り替えてつかう rvm 複数の Ruby 環境を切り替えることができる rvm というRubyバージョン管理ツールがあります。便利なので使いましょう。これで、既存の環境を残したまま、Ruby1.9.2 と Rails3 を試してみることが出来ます。 rvm のインストールは、GitHub からするのが推奨されています。gem でインストールするのが簡単なんですけどね。。。 Installing RVM - RVM: Ruby Version Manager 第39回 RVM(Ruby Version Manager)による環境構築 - Gihyo.jp 第40回 RVM(Ruby Version Manager)による環境構築(2) - Gihyo.jp RVMでRailsのバージョンを管理する - DoRuby! Rails3 Doc Rails3 Doc(英語) Rails: Complete API - 37Signals Rails3 ドキュメント翻訳プロジェクト Translating Rails Guides - GitHub Rails3 に対応しているプラグイン一覧 Browse Plugins - RailsPlugins.org Rails3 に関するそのほか WEB+DB PRESS Vol.58 の Rails3 記事がすごくいい! WEB+DB PRESS Vol.58 編 (著), WEB+DB PRESS編集部 (編集) 技術評論社 WEB+DB PRESS vol.58 の Rails 3 / Ruby1.9.2 記事が素晴らしすぎる件 - まちゅダイアリー

  • Ruby on Railの開発で役立つサイトや書籍

    現在、時期プロジェクトでRuby on Railsを使ってシステム開発を行うためRuby on Railsを勉強中の者です。 railsはもちろんrubyも初心者です。 現在「RailsによるアジャイルWebアプリケーション開発」という本を読んで勉強していますが、他にも参考になる書籍やサイトなどがあれば教えて頂きたいです。 宜しくお願いします。

    • ベストアンサー
    • Ruby
このQ&Aのポイント
  • A4用紙での印刷はスムーズに行えるのに、はがき印刷では詰まってしまう問題が発生している場合、解決方法はあるのでしょうか?
  • EPSON社製品のプリンターを使用している場合、A4用紙での印刷は問題なく行えるのに、はがき印刷では詰まってしまうという状況に悩まされている方も多いでしょう。
  • この問題について、EPSON社製品を使用してはがき印刷で詰まる場合の解決方法や対策についてまとめました。
回答を見る