ベストアンサー

ブラウザから直接HTMLを取得する方法

2008/07/23 18:31

IEの「表示」－「ソースの表示」のようなイメージで、現在ブラウザに表示されているHTMLを取得するのには、どのような方法があるでしょうか？ MSXML等を利用してWebサーバからHTML（HTTPレスポンス）を取得する方法はネット上で見かけますが、ブラウザから直接HTMLの情報を取得したいのです。どうぞ、宜しくお願いいたします。

verdy2008
お礼率55% (5/9)

その他（プログラミング・開発）
回答数3
ありがとう数9

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

pick52
ベストアンサー率35% (166/466)

2008/07/25 12:58 回答No.3

まず、何で何をしたいのかが不明確です。例えば、開発言語は何か。また、それは既存のブラウザの一部として動作するものなのかIEコンポや Geckoエンジンのようなものを使用して作成した独自ブラウザなのかそれともまったく完全にオリジナルのソフトを使用しているのかなどによっても異なると思います。 IEの拡張ツールバー(アドオン)として実装したいというのなら、 Browser Helper Objectに関する日本語情報はほとんどないので英語をよく読むしかないでしょう。

参考URL：: http://search.yahoo.co.jp/search?p=Browser+Helper+Object&ei=UTF-8&fr=top_ga1&x=wrt&meta=fl%3D3

質問者

補足 2008/07/25 14:23

開発言語は特に問いません。既存のWebアプリのページに表示されている内容を基に、帳票出力等を行いたいのです。出来れば、IEの拡張ツールバーとして実現出来ればと思っていましたので、Browser Helper Objectについて調べてみたいと思います。ありがとうございました。

その他の回答 (2)

steel_gray
ベストアンサー率66% (1052/1578)

2008/07/24 09:55 回答No.2

#1です。ブラウザの拡張って事だとちょっと私にはわからないです。 Javascriptがそこそこわかるので、私だったらJavascript(Bookmarklet)でやるかもしれない。

steel_gray
ベストアンサー率66% (1052/1578)

2008/07/23 18:52 回答No.1

どういった機能を欲しているのかちょっとわかりません。逆にソース表示ではなにが足りないのでしょうか？ファイルメニューの「名前を付けて保存」ではディスクに（関連ファイルも含めて）保存できるのでソース表示よりは便利かも。ページの情報収集という広い観点でいえば、IEなら Internet Explorer Developer Toolbar http://www.google.com/search?q=Internet+Explorer+Developer+Toolbar Firefoxなら Firebug http://addons.mozilla.org/ja/firefox/addon/1843 や Web Developer http://lab.tubonotubo.jp/tools/webdeveloper/index.html などをブラウザに組み込むとwebページの分析に役立つと思います。

質問者

補足 2008/07/23 23:16

steel_grayさん、早速のご回答ありがとうございます。やりたいことは、既存のWebシステムのページを解析してファイル保存や帳票を出力するといったようなことです。既存のシステムには手を加えられない事情があり、出来ればGoogleツールバー等のようにツールバーにボタンを配置して、そこから印刷などを行えればと思っています。以上、宜しくお願いいたします。

関連するQ&A

ダイナミックHTMLの取得方法
ブラウザでURLにアクセスすると電力を表示する装置があります。電力の値だけを取り込んでファイルに保存したいのですが、 HTMLソースを取り込んで見ると、Javascriptで書かれたプログラムが含まれており、 WebサーバーにあるPearlのプログラムに10秒毎にアクセスして値を更新しているようです。この更新された値をファイルに保存するにはどんな方法がありますか？
- 締切済み
- JavaScript
ブラウザでHTTPレスポンスがうけとれない
単にＩＤを返すだけのWebサーバに、telnetから80番ポートにアクセスし、HTTPリクエストを送るとレスポンスを受け取れるのにブラウザからアクセスするとレスポンスを受けとれずタイムアウトになってしまいます。 WireSharkでパケットを調べてみると、ブラウザからアクセスした場合も、問題なくWebサーバからＩＤが返されていることは確認できました。しかし、ブラウザではサーバからのレスポンス待ち状態が続き、しばらくするとタイムアウトになってしまいます。また、他のＰＣのブラウザから該当のWebサーバにアクセスすると、問題なくレスポンスをうけとりＩＤがブラウザに表示されることも確認しました。何が原因でこういうことが起こるのでしょうか。教えて頂けると大変助かります。 OS：Windwos 7 32bit ブラウザ：Explore8,Chrome サーバからのレスポンス(telnetでアクセスした際に取得したもの) HTTP/1.1 200 OK Content-Type: text/plain Server: Microsoft-IIS/6.0 X-Powered-By: ASP.NET Date: Mon, 20 Jan 2014 11:12:37 GMT Connection: close SYJ0P48
- ベストアンサー
- その他([技術者向] コンピューター)
CGIでのHTMLソース取得について
現在CGIでのHTMLソース取得を考えています色々と調べてみたのですがLWPやHTTP::Liteを使う方法が見つかりましたが使用しているレンタルサーバーの仕様上それらのモジュールの使用が出来ないため他の方法での取得ができないか考えています cronでの運用を考えているためなるべくcgiもしくはphpなどのサーバーサイドスクリプトで作りたいと考えていますご回答お願いします
- ベストアンサー
- CGI
WebページHTMLをテキストファイルとして取得する方法
今、WebページのHTMLで例えば、ADDと言う文字があれば、削除するような処理をしようと考えているのですが、 C/C++なら文字検索を行い、削除することはできるのですが、 WebブラウザからHTMLソースを取得したあとテキストベースで削除処理をすると考えています。 (1) C/C++でHTMLソースを取得するにはどうしたらいいのでしょうか？ (2) HTMLソースをテキストファイルにして文字検索後削除という処理を考えていますが、もっと簡単な方法はありますか？よろしくお願い致します。
- 締切済み
- C・C++・C#
ブラウザの表示→ソースからＨＴＭＬソースが見れない
ブラウザの表示→ソースと行けばＨＴＭＬソースが見れるはずなのですが、ある時から突然ソースが見れなくなってしまいました。ＷＩＮ＆ＩＥユーザーです。
- ベストアンサー
- HTML
ajaxでサーバより取得したHTML断片文字列をブラウザに正しく表示させたい
質問１ ajaxを利用してWebサーバから「<B>hoge</B>」のような文字列を取得することはできたのですが、それをブラウザ上に太字のhogeとして表示させたいのですが、ブラウザでタグが解釈されず「<B>hoge</B>」のまま表示されます。サーバから取得したHTML断片文字列をブラウザに解釈させて表示させるにはどうしたらよいのでしょうか。質問２ appendChild()を繰り返し実行すると、既に取得済みの文字列に対して、新たに取得した文字列がアペンドされます。アペンドさせずにボタン押下で取得した文字列だけを画面に表示させるにはどうしたらよいのでしょうか？よろしくお願いいたします。 JavaScript var disp = document.getElementById('disp'); disp.appendChild(document.createTextNode(xmlhttp.responseText)); HTML出力位置 <div id="disp"></div>
- ベストアンサー
- JavaScript
HTML文にない［>］がブラウザに表示される
HTMLをブラウザで表示したところHTML文にない文字［>］が表示されます。 FireFoxで該当箇所のソースを見ると、［>]のコードが入っています。ところがエディタ（TeraPad）でソースを見ても、同じ箇所には［>]または［>］がありません。このコードの前後を書き換えても、ＦＦやＩＥでは［>］が表示されます。原因と対策をお教え下さい。
- ベストアンサー
- HTML
Webページのテキスト文字を取得したいです。
VB.NET、WinXP-SP2環境なのですが、 Webページのhtmlソースではなく、表示されているテキスト文字だけを取得したいです。ＶＢでインターネットエクスプローラーを起動して、 Navigateでページを表示して、そこから IE.Document.body.outerText()などでやってもできると思うのですが、出来ればＩＥなどのＷｅｂブラウザは使わないで WebClientのDownloadやOpenReadを使って取得した htmlソースから抜き取るような方法があればと思うのですが、もしＩＥなどのＷｅｂブラウザを使わないで取得する方法があったら教えてほしいです。よろしくおねがいいたします。
- ベストアンサー
- Visual Basic
ブラウザでのHTMLダウンロード
ブラウザである動的ページをダウンロードし、ユーザがオフライン環境でもWebページを閲覧できるようにしたいと考えています。そこで、質問ですが、動的ページをダウンロードするには、どういった方法があるでしょうか？ブラウザでは、例えばIEの場合、名前を付けて保存とすればそのページを表示するのに必要な全ファイル（CSS,HTML,画像等）をダウンロードできます。こういった方法しかないのでしょうか？また、名前を付けて保存とすると、たまに、「このページは正しく保存されない可能性があります」というメッセージが表示されます。これはどういったHTMLの場合に表示されるのでしょうか？（これはJavaというよりもブラウザの質問ですね・・・）私の目的は、確実に動的ページをオフライン環境でも閲覧できるようにすることです。そのためには、動的ページを構成する全ファイル（CSS,HTML,画像等）のダウンロードが必須です。どなたか詳しい方、ご教授をよろしくお願いいたします。
- ベストアンサー
- Java
HTMLとブラウザについて
ブラウザは、レンダリングエンジン（TridentやWebkitなど）によって、HTMLの構文違いでちょっとした表示の違いなどを生むと思います。そんな中、W3Cという認証がHTMLにはあると思います。この認証は100点を取ってればいいと記載されてるかと思いますが、TridentやWebkitなど各種レンダリングエンジンでも大きな違いなくHTMLが表示されるということでしょうか。（ブラウザ、たとえばIE,FireFox,Chromeなどでの表示に差が出なくなる？）
- ベストアンサー
- HTML

ブラウザから直接HTMLを取得する方法