• 締切済み

webページからのテキスト取得

皆様お世話になっております。 データ収集のhtmlを作成しております。 すでに存在するいくつかのwebページ内の テキスト文字を取得して、 別のひとつのwebページへ貼り付け表示したいのですが、 何か方法はございますでしょうか? 何卒宜しくお願い致します。

  • magm
  • お礼率10% (5/47)
  • HTML
  • 回答数2
  • ありがとう数0

みんなの回答

  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.2

いわゆる「パース」という手法ですので 「html パース」とか「html パーサー」とかで 調べるとイロイロヒットします。

回答No.1

サーバ上でやりたいのかローカルでやりたいのかはっきりしませんが、HTMLだけでは無理です。 収集したいwebページが、貼り付け先のHTMLと同じサーバにあるのでしたらAjaxで取得できます。 そうでないならCGIプログラムを作る必要があるでしょう。 それから人様のwebページを収集して表示するのでしたら、著作権の問題があります。

magm
質問者

補足

早々のお発言ありがとうございます。 今件はローカルで出来たらなと思っていたものです。 ネットワーク機器の温度監視を行っているのですが、 機器毎に生成されるいくつかのwebページの一部を収集して、 ひとつのhtmlページへ一覧として出したいと考えたものです。 少し私には難しそうです・・・ どなたかcgiサンプルなどございましたら、 ご紹介お願い致します。

関連するQ&A

  • Webページのテキスト文字を取得したいです。

    VB.NET、WinXP-SP2環境なのですが、 Webページのhtmlソースではなく、表示されている テキスト文字だけを取得したいです。 VBでインターネットエクスプローラーを起動して、 Navigateでページを表示して、そこから IE.Document.body.outerText()などでやってもできると 思うのですが、出来ればIEなどのWebブラウザは使わないで WebClientのDownloadやOpenReadを使って取得した htmlソースから抜き取るような方法があればと思うのですが、 もしIEなどのWebブラウザを使わないで取得する方法があったら 教えてほしいです。 よろしくおねがいいたします。

  • WebページHTMLをテキストファイルとして取得する方法

    今、WebページのHTMLで 例えば、ADDと言う文字があれば、削除するような 処理をしようと考えているのですが、 C/C++なら文字検索を行い、削除することはできるのですが、 WebブラウザからHTMLソースを取得したあとテキストベースで削除処理をすると考えています。 (1) C/C++でHTMLソースを取得するにはどうしたらいいのでしょうか? (2) HTMLソースをテキストファイルにして文字検索後削除という処理を考えていますが、もっと簡単な方法はありますか? よろしくお願い致します。

  • VBA:webページのデータ取得

    お世話になります。 現在、VBAを勉強しており、webページのデータを取得するツールを個人的に開発しております。開発中に不明点がでましたのでご質問いたします。 ※インターネット上で一通り探しましたが、解決策は見つかりませんでした。 現状、HTMLファイルのデータは取得はできております。(ソースといわれるものです) ただ、ソース上にはjavascriptで記述されているところが多々あり、javascript側でHTMLを生成している場合、このデータを取得することができません。 ソースではなく、実際にwebページに表示されているHTML・CSSなどを取得したいと考えておりますが、取得する方法は存在するのでしょうか? もしご存知でしたらご教示いただきたく思います。 以上、よろしくお願いいたします。

  • textデータをWebページに読込むJavaScript

    GoogleAdsenceでは、JavaScriptを組み込んだWebページから、別のファイルのデータを読込んで表示する仕組みになっていますが、これはどうしたら出来るのでしょう。 別にGoogleみたいにWebページを解析してデータを表示したいとか大それたことじゃなくて、自社のホームページに、最新情報をTEXTで1~2行表示しているのですが、しょっちゅうそれが変わります。そしてその文章を作る人がHTMLがわからないので、変更する時に私がWebページをいちいち更新しています。 できればその人がCGIフォームで最新情報を入力すれば、WebサーバーにData.txtみたいなファイルに内容が保存されて、それを表示するWebページの一部にJavaScriptでData.txtの内容を読込んで表示する、という感じにしたいのですが・・・私のいわんとすることわかりますでしょうか

  • 【Excel】 Webページのテキストを貼り付けたい。

    こんにちは Webに表示されたデータの一部を範囲選択し、 Excelに貼り付けますが、リンクや画像は要りません。 これまでは、貼り付けた後に「貼り付け先の書式に合わせる」としてテキストで貼り付けをしていました。 しかし今日、同じことをしようとしたのですが、 なぜか「貼り付け先の書式に合わせる」をしても、画像やリンクがそのままになってしまいます。 設定を変えたつもりは無いのですが・・・。 何か考えられることを、アドバイスいただけたらと思います。

  • 【WEBページのタイトルをテキストに書き出したい】

    かなり大まかなご相談なのですが、どうすればいいか悩んでおりますため、どうかお知恵をお貸しください。 IEで表示しているページのURLを取得して、ローカルに置いてあるテキストに書き出したいと思っております。 (1)右クリックで出てくるコンテキストメニューに「URL保存」という項目を追加 (2)それを選択すると、右クリックしたWebページのURLが、テキストファイルに追加記入される。 という機能を作ろうと思っておりましたが、 (1)については 右クリックメニューを拡張できるフリーソフト(SHCML等)をいくつか利用してみましたが、 「IE上(WEB上)」で右クリックした時に出てくるメニューに、フリーソフトを使って登録した項目が出てきてくれません。 IE用のコンテキストメニューを追加するには、また違った作業が必要なのでしょうか。 (2)については、 ↑の右クリックで登録できる実行ファイルはexeかvbs拡張子、と以前どこかで読んだため(間違った情報かもしれませんが…) 当初VBSで作っていたのですが、どうしても「表示されているページ」を選んで取得することができませんでした。 JavaScriptであれば、http://www.openspc2.org/reibun/javascript/link/011/index.htmlこちらの ページなどを発見できたのですが、JavaScriptはWebページ作成時にHTML内に記載して使用したことしかなく、 これをどう”実行ファイル”として「右クリックで動作する」ようにしていいのかがわかりません…。 上記についてご教授いただけませんでしょうか。 最終的に【IEで表示しているページ(複数開いていた場合、選択したページのみ)のURLを取得して、 ローカルに置いてあるテキストに書き出す】という事が出来れば良いので、 やり方は上記にこだわりません。 もし”こうした方がいい””こうすればできる”などございましたら、アドバイスいただけますと嬉しいです。 色々と素人で、分からない事だらけのため、言葉足らずな質問になっておりましたらすみません。 宜しくお願いします。

  • ウェブページから手軽にスクレイピングしたい

    ウェブページに対して、XPATHを書く事で手軽にテキストデータを取得できないかと思っています。 イメージしているのは、プログラムを書いてスクレイピングするのではなく、ブックマークレットみたいな感じで、ウェブページに対してXPATHを書いたらすぐにスクレイピング結果のテキストデータが取得できるようなものです。 HighlightXPath( http://haraita9283.blog98.fc2.com/?tag=Bookmarklet )っていうのがありますが、こんな感じにブックマークレットを呼び出してXPATHを書いたらパっとテキストデータが取得できるようなもの、ないでしょうか。

  • webページのコピーができない

    インターネットでデータ収集する際にWebページを必要な箇所を指定しコピーしてワードに貼り付けしてPDFに加工して保存しているのですが、最近ワードに貼り付けができません。何か設定が変わったせいでしょうか。教えてください

  • ページ訪問者のwebページ訪問履歴を取得したい

    よく変なアダルトサイトに行くと 訪問者の名前、IPアドレス、メインのメールアドレスが ブラウザ上に表示される事がありますよね? 例えば鈴木さんが変なサイトにアクセスしたら 「こんにちは鈴木さん」という文字がでるようなやつです このような仕組みで webページ訪問者の訪問履歴のページURLを取得する事はできないのでしょうか? 例えば Aさんが該当のページにアクセスした場合 「Aさんが過去に訪れたページは…」 という形で過去数件分の訪問したページの履歴を表示するという事です 履歴を表示するだけで良いので 別にこのデータを取得して保存したいというわけではありません カテゴリ違いだったらすいません よろしくお願いします

    • 締切済み
    • PHP
  • Webページ保存

    あるWebページを上の部分の「ファイル」で、「名前を付けて保存」というところをクリックし、ファイルの種類をテキストファイルで保存して、そのテキストファイルを開いたら、文字化けしてしまいます。 どうすれば、Webページを保存できるのでしょうか?(テキストファイルでは保存できないのでしょうか) Webページ完全で保存した場合、ブラウザを開く形になりますよね? そのブラウザのWebページが消えていた場合、その保存したWebページ、完全(html,htm)も表示できない(消えてしまっている)のではないのですか? ですから、テキストファイルで保存したいと思ったのですが、文字化けしてしまいます。 良きご回答のほど、よろしくお願いします。