• 締切済み

VBAでWEBページのURL抽出について

エクセルのVBAにおいてWEBページのURLを抽出するマクロを考えております。 具体的に言うと、下記のようなwebページのタグがある中でhrefで参照しているURLを抽出したいと考えております。 <a class="" href="">あいうえお</a> GetelementByClassNameを使うことで文言の抽出はできるのですが、リンク先の抽出はできないのでしょうか?

みんなの回答

  • Chiquilin
  • ベストアンサー率30% (94/306)
回答No.3

手元に Excel2010しかないので記憶任せですが =FILTERXML("<b>"&A1&"</b>","//a/@href") > GetelementByClassName ClassNameじゃないのでは? JavaScriptだったら getElementsByTagName('a').getAttribute('href') なんですけどね。

  • Chiquilin
  • ベストアンサー率30% (94/306)
回答No.2

マクロでももちろんいいんですが Excel2013以降なら FILTERXML関数で簡単に取り出せますよ。

  • togurin
  • ベストアンサー率45% (81/180)
回答No.1

VBAは分からないのですが同じような質問がありました。 https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1252282782 いかがでしょうか。

関連するQ&A

  • ページソースからのURL抽出

    VBでページソースにあるURLを全て抽出したいと考えています。 どのようにすれば良いか教えてください。 サンプルコードがあると助かります。 具体的には、以下の通り。 (1)ウェブページのソースを読み込む (2)読み込んだソースを1行ずつ探索し<a href="****">の****の部分を全て読み込んでいく (3)ExcelのURL欄に順に入力していく (4)URL一覧の出来上がり よろしくお願いします。

  • VBAで有効なURLのみ抽出する方法

    無数あるURLリストをエクセルに張り付けし、 その中から応答のあるURL(つまりリンク切れしていないURL)のみを抽出することは可能でしょうか? リンクの有効判定をすることはマクロで実現可能でしょうか? 実現可能であれば、どういった記載方法になるでしょうか?

  • エクセルVBAにてURLの抽出

    エクセルVBAのマクロを用いてテキスト(ソースコード)よりURLを取得したいと考えています。 <a href="**"> 左記の「**」を取得し、エクセル上に 一覧として出力するものを想定しています。 なお、ソース上にhrefのコードは複数存在するので、 それら全てを出力したいのです。 以下が出力希望例になります。 <a href="http://www.test.co.jp"> <script type="text/javascript"> <a href="http://www.test2.co.jp"> 出力結果 http://www.test.co.jp http://www.test2.co.jp 諸事情があり、テキストを読み込んでエクセル上に取得する形式でお願いしたいです。 すみませんが、よろしくお願いします。

  • URL抽出

    指定したURLのソースから<A HREF="~">タグの"~"部分を抜き出してリスト化するようなURL抽出ツールを作りたいのですが、どのようにプログラムを書けばよいのかわからずに困っています。 わかるかた、回答のほどをよろしくお願いします。

  • 一つの行にURLが複数ある場合の、URL抽出方法は?

    htmファイルの中から、リンクされたURL情報を抽出するのが今回の目的です。 ご相談したいのは、URL情報が一つの行中に複数ある場合の抽出方法です。 ちなみに「一つの行にある<a href>リンクが一つだけ」の場合ですと、正規表現 <a +href=('|\").*('|\") *> でURLデータを正しく抽出できるところまで来ています。 ですが一つの行にある<a href>リンクが2つ以上あった場合は、最長一致のルールに従って、うまく抽出できません。 具体的に申し上げると、 ケース1:<a href="www.hoge.htm">ほげ</a> <a href="www.hoge.htm"> が抽出できる。 ケース2:<a href="www.hoge.htm">ほげ</a><a href="www.hogehoge.htm">ほげほげ</a> <a href="www.hoge.htm">ほげ</a><a href="www.hogehoge.htm"> が抽出される。(本当は2つを別々に取り出したい)

  • 複数のWebアドレスからURLを抽出する方法はありませんか?

    複数のWebアドレスからURLを抽出する方法はありませんか? 例えば下記のような2つ以上のURLからリンクされているURLを一気に抽出する方法はあるのでしょうか? http://www.google.co.jp/ http://www.yahoo.co.jp/ 私はIrvineというダウンロード支援ソフトを使用しています。 ブラウザに表示されているwebページはこのソフトの機能を使ってURLを抽出することが出来ますが、それはあくまで現在表示されているページのみです。 もっと効率よくURLを抽出する方法がないかと質問しました。

  • 【Excel】Webページからデータ抽出【VBA】

    面倒な作業を一括して出来るようにしたく、 質問させて頂きました。 VBAで実行したい項目を挙げます。 1.特定のWebページを開く 2.日付を取得する 3.指定した日付の行を取得する 4.行のタイトル(文章)と、リンクのURLを取得する 5.指定した日付(10月1日~10月20日まで)などの   データを(タイトルとリンク)Excel上に記入 以下の図のような感じです。 Webページは個人的なものなので 教えることが出来ないため、 このような図で申し訳ないです。 また、必要な情報(足りない情報)がありましたら 追加しますので、よろしくお願い致します。

  • フレームで開いたページのリンク抽出

    インラインフレーム、フレーム、新規ウィンドウなどでウェブページを開いてリンクを抽出するにはどうしたらよいのでしょうか? 試した方法は、親ファイルでiframe名.location.href="目的のURL"としインラインフレームでウェブページを開いた後、 http://blog.bulknews.net/mt/archives/001099.htmlのブックマークレットをiframe名.location.href="ブックマークレット"でリンク抽出しようとしたのですが、ブラウザはブックマークレットとして認識してくれず、「ページが表示できません」となってしまいます。 ただ、ウェブページではなくローカルに置いたファイルを開いたのち、同じくiframe名.location.href="ブックマークレット"すると上手く動作してくれるのですが…… ウェブページでもブックマークレットを動作させる方法、あるいは親ファイル内のjavascriptでブックマークレットに相当する動作をするjavascriptの書くなどがあればぜひ教えてください。

  • URLの抽出できるソフトありますか?

    一枚のホームページに画像がいくつもあったとします。画像にはリンクがしてありクリックすると各ページに飛ぶ仕組みになっています。 画像のURLとリンク先のURLと各ページのタイトルをエクセルに入力していますが、数があり結構しんどいです。 なにかフリーソフトで簡単に抽出できるものはないでしょうか? よろしくお願いします。

  • VBAを使ってHTMLソースから特定の文字を抽出2

    前回ExcelでVBAを使って「http://www.nankankeiba.com/calendar/201204.do」のサイトからHTMLソースから<em></em>タグ内の<a href="URL">のURL情報だけを抽出するコードを教えて頂きました。 そこで、取り込んだデータの更に下に「http://www.nankankeiba.com/calendar/201210.do」からも同じように<em></em>タグ内のURLデータを取得して表示したいのですが、ページ移動しても同じ情報を取得したり上手くいかないのでアドバイス頂けないでしょうかm(_ _)m 上のURLだけを取り込むコードはこちらになります。 http://uproda.2ch-library.com/800072670/lib800072.txt イメージとしてこの様にしたいです。 http://uproda.2ch-library.com/800071Xz0/lib800071.jpg

専門家に質問してみよう