• ベストアンサー

ブラウザから直接HTMLを取得する方法

IEの「表示」-「ソースの表示」のようなイメージで、現在ブラウザに表示されているHTMLを取得するのには、どのような方法があるでしょうか? MSXML等を利用してWebサーバからHTML(HTTPレスポンス)を取得する方法はネット上で見かけますが、ブラウザから直接HTMLの情報を取得したいのです。 どうぞ、宜しくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • pick52
  • ベストアンサー率35% (166/466)
回答No.3

まず、何で何をしたいのかが不明確です。 例えば、開発言語は何か。 また、それは既存のブラウザの一部として動作するものなのかIEコンポや Geckoエンジンのようなものを使用して作成した独自ブラウザなのか それともまったく完全にオリジナルのソフトを使用しているのか などによっても異なると思います。 IEの拡張ツールバー(アドオン)として実装したいというのなら、 Browser Helper Objectに関する日本語情報はほとんどないので 英語をよく読むしかないでしょう。

参考URL:
http://search.yahoo.co.jp/search?p=Browser+Helper+Object&ei=UTF-8&fr=top_ga1&x=wrt&meta=fl%3D3
verdy2008
質問者

補足

開発言語は特に問いません。 既存のWebアプリのページに表示されている内容を基に、帳票出力等を 行いたいのです。 出来れば、IEの拡張ツールバーとして実現出来ればと 思っていましたので、Browser Helper Objectについて 調べてみたいと思います。 ありがとうございました。

その他の回答 (2)

  • steel_gray
  • ベストアンサー率66% (1052/1578)
回答No.2

#1です。 ブラウザの拡張って事だとちょっと私にはわからないです。 Javascriptがそこそこわかるので、私だったらJavascript(Bookmarklet)でやるかもしれない。

  • steel_gray
  • ベストアンサー率66% (1052/1578)
回答No.1

どういった機能を欲しているのかちょっとわかりません。 逆にソース表示ではなにが足りないのでしょうか? ファイルメニューの「名前を付けて保存」ではディスクに(関連ファイルも含めて)保存できるのでソース表示よりは便利かも。 ページの情報収集という広い観点でいえば、IEなら Internet Explorer Developer Toolbar http://www.google.com/search?q=Internet+Explorer+Developer+Toolbar Firefoxなら Firebug http://addons.mozilla.org/ja/firefox/addon/1843 や Web Developer http://lab.tubonotubo.jp/tools/webdeveloper/index.html などをブラウザに組み込むとwebページの分析に役立つと思います。

verdy2008
質問者

補足

steel_grayさん、早速のご回答ありがとうございます。 やりたいことは、既存のWebシステムのページを解析して ファイル保存や帳票を出力するといったようなことです。 既存のシステムには手を加えられない事情があり、 出来ればGoogleツールバー等のようにツールバーに ボタンを配置して、そこから印刷などを行えればと 思っています。 以上、宜しくお願いいたします。

関連するQ&A

  • ダイナミックHTMLの取得方法

    ブラウザでURLにアクセスすると電力を表示する装置があります。 電力の値だけを取り込んでファイルに保存したいのですが、 HTMLソースを取り込んで見ると、Javascriptで書かれたプログラムが含まれており、 WebサーバーにあるPearlのプログラムに10秒毎にアクセスして値を更新しているようです。 この更新された値をファイルに保存するにはどんな方法がありますか?

  • ブラウザでHTTPレスポンスがうけとれない

    単にIDを返すだけのWebサーバに、telnetから80番ポートにアクセスし、HTTPリクエストを送るとレスポンスを受け取れるのに ブラウザからアクセスするとレスポンスを受けとれずタイムアウトになってしまいます。 WireSharkでパケットを調べてみると、ブラウザからアクセスした場合も、 問題なくWebサーバからIDが返されていることは確認できました。 しかし、ブラウザではサーバからのレスポンス待ち状態が続き、しばらくするとタイムアウトになってしまいます。 また、他のPCのブラウザから該当のWebサーバにアクセスすると、 問題なくレスポンスをうけとりIDがブラウザに表示されることも確認しました。 何が原因でこういうことが起こるのでしょうか。 教えて頂けると大変助かります。 OS:Windwos 7 32bit ブラウザ:Explore8,Chrome サーバからのレスポンス(telnetでアクセスした際に取得したもの) HTTP/1.1 200 OK Content-Type: text/plain Server: Microsoft-IIS/6.0 X-Powered-By: ASP.NET Date: Mon, 20 Jan 2014 11:12:37 GMT Connection: close SYJ0P48

  • CGIでのHTMLソース取得について

    現在CGIでのHTMLソース取得を考えています 色々と調べてみたのですがLWPやHTTP::Liteを使う方法が見つかりましたが 使用しているレンタルサーバーの仕様上それらのモジュールの使用が出来ないため 他の方法での取得ができないか考えています cronでの運用を考えているためなるべくcgiもしくはphpなどのサーバーサイドスクリプトで作りたいと考えています ご回答お願いします

    • ベストアンサー
    • CGI
  • WebページHTMLをテキストファイルとして取得する方法

    今、WebページのHTMLで 例えば、ADDと言う文字があれば、削除するような 処理をしようと考えているのですが、 C/C++なら文字検索を行い、削除することはできるのですが、 WebブラウザからHTMLソースを取得したあとテキストベースで削除処理をすると考えています。 (1) C/C++でHTMLソースを取得するにはどうしたらいいのでしょうか? (2) HTMLソースをテキストファイルにして文字検索後削除という処理を考えていますが、もっと簡単な方法はありますか? よろしくお願い致します。

  • ブラウザの表示→ソースからHTMLソースが見れない

    ブラウザの表示→ソースと行けばHTMLソースが見れるはずなのですが、 ある時から突然ソースが見れなくなってしまいました。 WIN&IEユーザーです。

    • ベストアンサー
    • HTML
  • ajaxでサーバより取得したHTML断片文字列をブラウザに正しく表示させたい

    質問1 ajaxを利用してWebサーバから「<B>hoge</B>」のような文字列を取得することはできたのですが、それをブラウザ上に太字のhogeとして表示させたいのですが、ブラウザでタグが解釈されず「<B>hoge</B>」のまま表示されます。サーバから取得したHTML断片文字列をブラウザに解釈させて表示させるにはどうしたらよいのでしょうか。 質問2 appendChild()を繰り返し実行すると、既に取得済みの文字列に対して、新たに取得した文字列がアペンドされます。アペンドさせずにボタン押下で取得した文字列だけを画面に表示させるにはどうしたらよいのでしょうか? よろしくお願いいたします。 JavaScript var disp = document.getElementById('disp'); disp.appendChild(document.createTextNode(xmlhttp.responseText)); HTML出力位置 <div id="disp"></div>

  • HTML文にない[>]がブラウザに表示される

    HTMLをブラウザで表示したところHTML文にない文字[>]が表示されます。 FireFoxで該当箇所のソースを見ると、[&gt;]のコードが入っています。 ところがエディタ(TeraPad)でソースを見ても、同じ箇所には[&gt;]または[>]がありません。 このコードの前後を書き換えても、FFやIEでは[>]が表示されます。 原因と対策をお教え下さい。

    • ベストアンサー
    • HTML
  • Webページのテキスト文字を取得したいです。

    VB.NET、WinXP-SP2環境なのですが、 Webページのhtmlソースではなく、表示されている テキスト文字だけを取得したいです。 VBでインターネットエクスプローラーを起動して、 Navigateでページを表示して、そこから IE.Document.body.outerText()などでやってもできると 思うのですが、出来ればIEなどのWebブラウザは使わないで WebClientのDownloadやOpenReadを使って取得した htmlソースから抜き取るような方法があればと思うのですが、 もしIEなどのWebブラウザを使わないで取得する方法があったら 教えてほしいです。 よろしくおねがいいたします。

  • ブラウザでのHTMLダウンロード

    ブラウザである動的ページをダウンロードし、 ユーザがオフライン環境でもWebページを閲覧できるようにしたいと考えています。 そこで、質問ですが、 動的ページをダウンロードするには、どういった方法があるでしょうか? ブラウザでは、例えばIEの場合、名前を付けて保存とすればそのページを表示するのに必要な全ファイル(CSS,HTML,画像等)をダウンロードできます。 こういった方法しかないのでしょうか? また、名前を付けて保存とすると、たまに、「このページは正しく保存されない可能性があります」というメッセージが表示されます。 これはどういったHTMLの場合に表示されるのでしょうか? (これはJavaというよりもブラウザの質問ですね・・・) 私の目的は、確実に動的ページをオフライン環境でも閲覧できるようにすることです。 そのためには、動的ページを構成する全ファイル(CSS,HTML,画像等)のダウンロードが必須です。 どなたか詳しい方、ご教授をよろしくお願いいたします。

    • ベストアンサー
    • Java
  • HTMLとブラウザについて

    ブラウザは、レンダリングエンジン(TridentやWebkitなど)によって、HTMLの構文違いでちょっとした表示の違いなどを生むと思います。 そんな中、W3Cという認証がHTMLにはあると思います。 この認証は100点を取ってればいいと記載されてるかと思いますが、TridentやWebkitなど各種レンダリングエンジンでも大きな違いなくHTMLが表示されるということでしょうか。 (ブラウザ、たとえばIE,FireFox,Chromeなどでの表示に差が出なくなる?)

    • ベストアンサー
    • HTML

専門家に質問してみよう