• ベストアンサー

JAVAを使ってホームページの情報を読み取るには?

今、JAVAを使って、HTMLファイルから特定の部位のみを 抜き出したり、加工したりはできるのですが、あくまで、ハードディスク にあるデータのみです。直接インターネットから取り込みたいのですが どこか、初心者でもそのまま使えそうな、参考になるソースを 公開したページはないでしょうか? また、特に、JAVAで作った簡易ブラウザのソースを公開して おられるサイトをご存知でしたら、教えてください。 何卒、よろしくお願いいたします。

  • Java
  • 回答数2
  • ありがとう数2

質問者が選んだベストアンサー

  • ベストアンサー
  • t-satoh
  • ベストアンサー率35% (211/591)
回答No.2

 HTMLを読み込むだけなら、 java.net.URLクラスを使用するだけで良いと思います。 下記は、ヤフーのサイトからHTMLを取得し、 表示するJSPです。 <%@ page contentType="text/html; charset=Windows-31j" %> <%@ page import="java.net.*" %> <%@ page import="java.io.*" %> <% URL url = null; BufferedReader in = null; String readString = null; url = new URL("http://www.yahoo.co.jp/"); in = new BufferedReader(new InputStreamReader(url.openStream())); while((readString=in.readLine())!=null) out.println(readString); in.close(); %>

tihiro_t
質問者

お礼

#1、#2様 回答いただきありがとうございます。 とても役に立ちました!!

その他の回答 (1)

  • anmochi
  • ベストアンサー率65% (1332/2045)
回答No.1

ん~? タイトルからは、「アプレットからアプレットが埋め込まれているページの情報を取得したい」と受け取ったのだが、ようするにJavaでWebブラウザを作りたいという事なのか? Webブラウザの基本動作はHTTPでファイルをもらってきて、それをHTMLと仮定して解析し、画面上に描画する事だな。 つまり、君のやりたい事で言うところの、「ローカルファイルを開いて読み出し」を「HTTPでデータを読み出し」に変えたいのだろう? サンプルは残念ながら用意できなかったが、HttpConnectionインタフェースというものがあるので、それをキーワードに色々探してみると良いのでは。

関連するQ&A

  • JAVA SCRIPTの縦スクロールについて教えて下さい

    JAVA SCRIPTについての質問です。 初心者なもので、よくわからないので教えていただきたいです。 縦に長いHTMLページの場合に、ページ内の特定の場所にリンクさせて(マウスでクリックした際に)スクロールしてその場所まで移動させたいのですが・・・ ページの一番上までスクロールして移動させる方法はわかったのですが、ページの途中の特定の場所でとめる方法がわかりません。 Y軸の値を指定すればできると思ったのですが、なかなかうまくいきません。 どなたか心優しい方、ソースをご教授いただけないでしょうか? お願いいたします。

  • javaの素材をホームページにアップするには、、、

    パソコン暦3年、ホームページ作成暦1年(趣味として) ホームページ作成経験はテキスト、画像、アニメgif、で、javaは参考アプレットを乗せたことがあるくらいのものです(updateは連日で現状は質より量というところ)。 PageMill3.0(forMac)を使っています。 javaにやっと取りかかり(★プログラミング言語が世の中にあるなんてことも、ちっとも知らなくて、javaがそのうちの一つだということをつい最近知って)、なにかファイルが出来ればページに乗せてみようとトライしています。 数日前にSunMicrosystemsを「発見!」、MRJ SDK2.2をDLし、サン社のページを参考にしながら、指南どうりに「アプレットが有効!よくできました!」のところまで来ました。 その過程で(1)HelloWorldApp.java、(2)HelloWorldApp.class、(3)HelloWorld.java、(4)Hello.htmlの4つのファイルを順に作りました。 前置きが長くなりましたが、質問は ページにアップすると、ページ読み込み時にjavaは起動するのですがエラーが出て読み込み出来ないのです。 PageMillで作成する時は、上のファイルのうち、(2)と(4)を置いても (3)と(4)を置いても、エラーがでてブラウザが閉じてしまいます。 javaソースとは(3)と(4)ではないのでしょうか? いつも画像を置く時のように(PageMillの)エディットソースは確認したのですが、エラーがどこだか、何だか分からないのです。昨夜もネットで(私の)思い付く限りのところは行ってみたのですが、なにしろ、「ド」beginnerなもので、、、 質問の表現も、分かりにくかったらお詫びします。(:_;) どなたか、アドバイス、参考URL(英語サイトでも)をよろしくお願いします。 ---マシンはiMac,cpu500,20G,memory192他、数台です---

    • ベストアンサー
    • Mac
  • Java ExcelのデータをWebページにセット

    こんにちは。Java、HTML共に初心者です。 以下の事をJavaで行いたいのですが、その方法(コーディングの仕方)が解らなくて困っております。 やりたいこと↓ (1)Excelデータの特定の行列(セル)に記述されているテキストデータを取得 (2)Webページのテキストボックスに(1)で取得したテキストデータをセット (3)Webページのボタンを押下する。 素人染みた質問で申し訳ないんですが、ご存知の方がいらっしゃいましたら、 お教え願います。

  • Javaで作ったWebブラウザをJavaScriptに対応させるには?

    JavaでWebブラウザを作っています。 HTMLのページはうまく表示されるのですが、JavaScriptが使われているページがうまく表示されません。 どうしたらいいのでしょうか?どなたかよろしくお願いします。

  • ホームページがブラウザーに表示される仕組み

    ホームページがブラウザーに表示される仕組みに関する質問ですが、 ホームページがブラウザーに表示される場合、サーバからそのホームページのデータ(HTMLコード)がそのブラウザーがインストールされているコンピュータに送信されていると思います。この場合、ホームページのデータ(HTMLコード)は、コンピュータのどこに保存されるのでしょうか?インターネット一時ファイル(Temporary Internet Files等)というものがありますが、これらは一度表示したWebページを再び開くときに高速化したり、Webページをオフラインで表示するためのものであり、ブラウザーにWebページを表示するためのデータの保管場所ではないように思いますが? そもそも、ホームページをブラウザーに表示するには、そのブラウザーがインストールされているコンピュータにホームページのデータ(HTMLコード)がサーバより送信され一旦”保存”される”必要”があるのでしょうか?それとも、一旦コンピュータにデータを保存しなくても、サーバにあるホームページのデータ(HTMLコード)が直接ブラウザーに表示されているのでしょうか? ご存知の方、お教え下さい。 また、詳しく説明してあるサイトのURL等ありましたら、お教え下さい。

  • JAVAについて学習(開発)

    現在はプログラミングとは無関係の仕事をしていますが、 Javaについて学んでみたくJavaをつかってブラウザ等の ソフトウェアが作れないかと考えています。 (Linux使用の経験もありますが、Windows XP上での開発を考えています。) ・Javaの開発環境(JDKなど...) ・エディタ(秀丸など...) ・初心者がJavaについて学べるサイト ・オープンソース ・その他ツールなど 上記について何方かアドバイスをいただけないでしょうか? Javaについては短大時代に少しかじった程度です。 学生時代に経験したプログラミング言語は BASIC、C、Perl、HTML、アセンブラ、Java (どれも1年未満になります。)

  • javaについて…

    友人のパソコンについてなのですが、 javaを要するページなどをみたときに、 ページが真っ白で左上にバツの絵文字が出るみたいなんです。 友人に聞くと、データなどを削除していった結果、 javaのデータ(?)を消してしまって、 javaを使用することが出来なくなったそうです。 実際にjavaの機能を消去することは可能なのでしょうか? 初心者の勝手な考えですが、 どう考えても設定などがおかしいと思うのです。 そこで、java機能を復活させる方法ってあるのでしょうか? もしくは設定がおかしいのであれば、 どこを操作したらjava機能などを回復させることが出来るのしょうか?

  • ホームページビルダーを使っています。

    はじまめして。 HPをはじめて作るのに(初心者)「ホームページビルダーV6.5」を使っているものです。 かなり出来上がって欲を出してフレームを付けようとがんばっているのですがどうしてもうまくいきません。 ※フレームHTMLソースの表示で <P>このページを表示するにはフレームをサポートしているブラウザが必要です</P> と、なっているところの「フレームをサポートしているブラウザ」とはなんなのでしょうか? 多分ここにしかるべきものを書き込んでいないのでうまくいかないのではないか勝手に思っています。 解りにくいかもしれませんが よろしくお願いします。

  • ホームページがブラウザーに表示される場合、データはどこに?

    ホームページがブラウザーに表示される仕組みに関する質問ですが、 ホームページがブラウザーに表示される場合、サーバからそのホームページのデータ(HTMLコード)がそのブラウザーがインストールされているコンピュータに送信されていると思います。この場合、ホームページのデータ(HTMLコード)は、コンピュータのどこに保存されるのでしょうか?インターネット一時ファイル(Temporary Internet Files等)というものがありますが、これらは一度表示したWebページを再び開くときに高速化したり、Webページをオフラインで表示するためのものであり、ブラウザーにWebページを表示するためのデータの保管場所ではないように思いますが? そもそも、ホームページをブラウザーに表示するには、そのブラウザーがインストールされているコンピュータにホームページのデータ(HTMLコード)がサーバより送信され一旦”保存”される”必要”があるのでしょうか?それとも、一旦コンピュータにデータを保存しなくても、サーバにあるホームページのデータ(HTMLコード)が直接ブラウザーに表示されているのでしょうか(特にブラウザー用のキャシュを有効にしていない場合)? ブラウザー用のキャッシュを有効にしていない場合、ホームページのデータ(HTMLコード)はインターネット一時ファイル(Temporary Internet Files等)にも保存されず、そのホームページをブラウザーに表示している間だけ一時的にメモリー上で保存されているのでしょうか? ご存知の方、お教え下さい。 また、詳しく説明してあるサイトのURL等ありましたら、お教え下さい。私もいろいろサイトを探しましたが、サーバとコンピュータ間のやり取りに関する記述が殆どで、ホームページをブラウザーに表示するには、そのブラウザーがインストールされているコンピュータにホームページのデータ(HTMLコード)がサーバより送信され一旦”保存”される”必要”があるのかどうかに係わる記述をしたサイトは見つけられませんでした。

  • インターネットで特定のページが表示されないんです。(java?)

    インターネットで特定のページが表示されません。 表示されないページのところにマウスの矢印を持ってくるとブラウザの左下の通常はリンク先のURLが表示されるところにjavascript:・・・(・・・部分はページによって変わります)と表示されます。 javaは最新版をインストールしてあります。 OSはXPのSP2です。 どうかよろしくお願いします。

専門家に質問してみよう