ホームページの整形/変換方法とは?

このQ&Aのポイント
  • インターネット上のホームページを自分用に整形して印刷する方法について教えてください。
  • プログラムやプラットフォーム環境を使って、インターネット上のホームページを直接アクセスして印刷する方法を知りたいです。
  • 具体的な手順やプログラム言語のおすすめなど、詳しいアドバイスをお願いします。
回答を見る
  • ベストアンサー

■ホームページ(HTML)の整形/変換

   いつもお世話になります。開発者としての質問です。  インターネット上に、よく利用するホームページがあります。 【やりたいこと】 ・このホームページを(自分用に)整形して印刷したいです。 【質問】 ・パソコン(インターネット上のサーバーでも良い)からこのホームページに アクセスして、自分用に整形フォーマットした形式で印刷をしたいです。 (直接でなくても一度、別のHTMLを作成してから、印刷しても全くかまいません)  そこで、  お勧めのプログラム言語かプラットフォーム環境を教えてください。 ■プログラムから直接インタネット上のホームページ(HTML)をアクセスした経験がないので、アドバイスをお願い致します。 ・どうやってインターネット上のHTMLをオープンすれば良いのか? (Java か VisualBasic がお手軽なのか) ・どうやって HTML 中のある部分を認識すれば良いのか?  よろしくお願いします。 《補足》 もう少し具体的に書くと... URL: http://www.hoge.com/top/page1 ページ1:【表A】 URL: http://www.hoge.com/top/page1 ページ2:【表B】 ===> プログラムを使って新たに【表X】を作成したいです。 元のホームページの【表A/B】は<Table>タグで決められた形で作成されていると して良いです。  

質問者が選んだベストアンサー

  • ベストアンサー
  • nda23
  • ベストアンサー率54% (777/1415)
回答No.3

先のテキスト解釈は美しくなかったですね。 もし、テーブルタグにIDがあるなら次のように取るのがオシャレかな。 例えば<TABLE ID='A'>の場合 doc.getElementById("A").outerHTML

trueimage
質問者

補足

Answer No1 に続き、No2, No3 ととても参考になります。 ありがとうございます!! テーブルタグにIDを付けておくのがお洒落ですね。 今回は既存のURLのHTMLなので、ID が付けられないのでガリガリとsearchとsubstringメソッドで参照するしかないと思っています。 複雑な処理になりそうなので、言語は、JavaScript か Java + GWT (=> JavaScript) にしようか悩んでいます。

その他の回答 (2)

  • nda23
  • ベストアンサー率54% (777/1415)
回答No.2

HTMLテキストから例えばTABLEタグを見つけるには var i = text.search(/<table/i); ※indexOfだと大文字小文字を区別します。searchの方は正規表現に"i"が付いているので、大文字小文字を区別しません。 同様にTABLEタグの終わりを見つけるには var j = text.search(/<\/table/i); ※"/"が正規表現の区切り文字にならないよう\を付けます。 後はsubstringメソッド等で切り分ければよいかと思います。

  • nda23
  • ベストアンサー率54% (777/1415)
回答No.1

「やりたいこと」がよく分からないのと、実行環境が不明なので何とも言えませんが、あるURLのページを開いて、中身のHTML文を取り出すWindows直下で稼動するプログラムなら、以下のようにすれば可能です。 JavaScriptの例 //InternetExplorerを起動する var ie = new ActiveXObject("InternetExplorer.Application"); //URLを開く ie.Navigate2("http://www.hoge.com/top/page1"); //ドキュメントの取得 var doc; while( ie.ReadyState != 4 ) {   WScript.Sleep(1); } doc = ie.Document; //チェック try {   var x = doc.mimeType; } catch(e) {   //エラーなので、画面を可視にして終了   ie.Visible = true;   WScript.Quit(); } //テキストを取得する var txt = doc.body.innerHTML; //IEを終了する ie.Quit(); この後、取り出したテキストを自分用に編集すればよいでしょう。 実際には2ヶ所のURLを拾うので、IE終了前にもう一度、Navigate2メソッド以降を実施して、次のHTMLテキストを取得します。 出来上がりはファイルに保存するか、IEでブランク画面を作り、そこへ書き込んで表示することもできます。

trueimage
質問者

補足

ご回答いただけて嬉しいです。 実行環境について書かなくて失礼しました。 ■Windows環境での実行を考えています。 (あるいは、サーバー上でのCGI(Perl)でも簡単であればどちらでも良いです)。 JavaScriptの例を詳しく書いていただけて大変助かります。 お書きの通り、「URLを開く」ことをやりたかったです。 取得のテキスト(HTML)の中のプログラムで、ガリガリ直接パースする方法でも良いのですが、HTML の中のテーブル・タグを認識する方法があればもっと助かるのですが、XML でないので無理なんでしょうね。 ありがとうございました。

関連するQ&A

  • ホームページのトップページについて

    はじめまして。 よろしくお願いします。 この度、「http://www.○○○.com」(○○○は例です) というドメインを取得し、ホームページを作成しています。 トップページには、「top.html」 というHTMLを作成し、サーバーにアップロードしました。 つまり、「http://www.○○○.com/top.html」がトップページのアドレスということになっています。 世の中の皆さんのホームページは、「http://www.○○○.com」もしくは「http://www.○○○.com/」と記載されたりしていますが、私のホームページの場合は「http://www.○○○.com/top.html」と、「top.html」をつけた形で記載しないと直接トップページにいくことができません。 「http://www.○○○.com」と記入すると、トップページが表示されるのではなくて、自分のホームページの中身(どんなHTMLがあるのかとか)の一覧が表示されてしまいます。 「http://www.○○○.com」もしくは「http://www.○○○.com/」と記入してトップページが表示されるようにするにはどのような設定を行えばよいのでしょうか? アドバイス宜しくお願い致します。

  • ホームページにwwwがつかなくなってしまいました。

    ホームページにwwwがつかなくなってしまいました。 ホームページをリニューアルしたら、トップページからサブページに移動後、 URLにwwwがつかなくなってしまいます。 トップページを表示・・・URLはhttp://www.hogehoge.co.jp/となっている トップページからサブページに移動・・・URLがhttp://hogehoge.co.jp/hogeとなり、wwwがなくなっている 再びサブページからトップページに移動・・・URLがhttp://hogehoge.co.jp/となり、wwwがなくなっている .htaccessファイルは触っていないですし、もともとリダイレクトうんぬんの記述はないようです。 www付きで統一したいです。 何が原因なのでしょうか?

  • ホームページ作成ソフト

    無料で使える高機能で、できればHTML言語の知識なしで使えるホームページ作成ソフトのダウンロードできるページのアドレスか、トップページのアドレスを教えてください。有料は嫌です。今、最初からパソコンに入っていたホームページミックスというソフトを使っていて、表を作りたいのですが、10×30にしたいけど5×Xにしかできません。とくに表が充実したソフトを教えてください。  それから、エクセルで作ったファイルをインターネット上に公開することは可能ですか。

  • HTMLとデータベースの連携

    プログラム初心者です、宜しくお願い致します。 現在、ネットショプを作成しているのですが HTMLのページで 表示する商品をデータベースで管理しようと頑張っていますが、分からないことだらけで困っています。 <したい事> ・TOPページにはデータベース内商品の更新日時、最新から○個取得表示 ・商品クリック時にINSERT文使用 自分なりに調べた結果、ACCESSを用いるのが最適と判断し作成していますが、HTMLからACCESSに接続方法。及びSQL文をHTMLに記述するのかACCESSにメソッド的なものを登録してHTMLからは呼び出すのか等基本的な事が分かりません。 ちなみに無料のレンタルサーバーを用いているのでHTMLファイルとACCESSファイルは同じフォルダ内に設置されます。 以上の事をインターネットで調べてみましたが欲しい回答が見つかりませんでした。宜しくお願い致します。

    • ベストアンサー
    • HTML
  • HTMLについて

    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"> <!-- saved from url=(0022)http://internet.e-mail --><!-- saved from url=(0022)http://internet.e-mail --> 参考書を片手にホームページビルダーでホームページをを作成したのですが、上記は何を意味するのでしょうか? 作成して1年以上経つのですが検索サイトにヒットしません関係有るのでしょうか?

  • ホームページビルダー14を使用してホームページを作っています。

    ホームページビルダー14を使用してホームページを作っています。 トップページにカウンターとアクセス解析のHTMLタグを貼りつけました。 以降、トップページをビルダー上で開こうとすると その度に「ネットワーク上のファイルを読み込みますか?」というようなダイアログが表示され、「はい」をクリックすると、読み込みが始まり3~5分ほど経ってからようやくトップページが表示される状況です。 1.こんなに長い時間読み込みにかかるものなのでしょうか?   実際にサーバーにアップしてホームページを公開した場合も、   ネットでトップページを開く度にこんなに時間がかかるといことはないですよね? 2.読み込みますか?と聞かれて「いいえ」にした場合は、何か問題がありますか?   「はい」をクリックした時との違いは何ですか? 3.アクセス解析のHTMLタグはトップページ以外のページにも貼り付けなくてはいけませんか? 開く度にあんなに待たされるとおっくうで正直アクセス解析をやめようかと思ってしまいます。 fc2を使用していますが、他の会社のものだとこんなことにはならないのでしょうか?? ご回答宜しくお願いします。

  • HTMLでのホームページ作りについて

    これからホームページ作成の仕事をしたいと考えています。 HTMLでのWEB作成について教えてください。 最近は、ホームページ作りと言うと無料で簡単に作れるというサイトを多く目にしますが HTMLと無料で作れるページとの違いを教えてください。 1.メリット、デメリットは何ですか? 2.今後ホームページ作りに時間を掛けるならどちらの方が将来性がありますか?

  • Perl+HTMLホームページビルダー的な物を探しています。

    最近Perlを勉強している物です。 元はホームページから勉強を初めて、Perlと出会い、勉強するようになりました。 一つ大変な事はPerlで動的なページを作成し、それをデザイン的に凝ったページに仕上げようとした場合です。 私の方法は次のような作業です。 (1)HTMLをHPビルダーなどを使用し作成する (2)Perlをプログラム的に解りやすいエディタを使い作成する (3)(1)で作成したHTMLをコピーし、Perlで作成されたページに張り付け最終的な調整をして完成 となっています。 ホームページビルダーのようにHTMLをすぐに表示確認できる、プラスPerlが一緒に組み込まれていても表示できるようなソフトはあるのでしょうか?どうかご存知の方は教えて頂けないでしょうか お願いします。

  • 自分で作ったHTMLを友達も見れるようにホームページ化したいのですが

    自分で作ったHTMLを友達も見れるようにホームページ化したいのですが HTML初心者ですが この前から頑張ってHTMLをやっと完成させました! ですが拡張子HTMLで開いても自分のデータの中からHTMLで見るので URLとかを作成していません。そこでURLを作ってHTMLを導入する方法を教えてください! あんまり日本語うまくなくてすみません...

  • 静的URL変換について

    現在,phpでウェブサイトを作成しているのですが、 サイト内検索をしたときのURLを静的化できないか、考えております 例)getで送った際のURL hoge.com/search.php?keyword=hoge 修正後 hoge.com/kewyword_hoge.php そして、その際にやりたいことは、hoge.com/kewyword_hoge.phpをインデックスさせ このURLのページにアクセスしてきたときにhoge.com/search.php?keyword=hogeを 実行するようにしたいのですが、これって可能でしょうか? 静的URL変換自体は問題ないのですが、 hoge.com/kewyword_hoge.phpにアクセスしてもhoge.com/search.php?keyword=hoge を実行してくれず困っております。 恐れ入りますが、解決策をご教授いただけませんでしょうか? 何卒宜しくお願いします。 また、私のやりたいことは以下のサイトで参考になります。 ■インデックスされているURL(google) http://j-sen.jp/kanto/keyword_%E3%81%86%E3%81%A9%E3%82%93.htm ■サイト内検索のURL http://j-sen.jp/search/?area=kanto&nmin%5Bname%5D=&nmin%5Btime%5D=&nmin%5Bn%5D=&wage=&freeword=%E3%81%86%E3%81%A9%E3%82%93&day=&hour=&feature%5B%5D=&feature%5B%5D=&medical=1&except_medical=0&x=82&y=22 どちらも検索結果は同じですが、サイト内検索のURLを静的化し、 google先生にインデックスさせています。 お手数ですが、改めて解決策のご教授お願い申し上げます。

    • 締切済み
    • PHP

専門家に質問してみよう