• 締切済み

HTMLのAタグからURLとリンクラベルを抽出できるソフト

初めまして。 閲覧中のページ内のリンクを、URLとラベルのセットで抽出して一覧表示してくれるソフトを探しています。 具体的には <a href="url">リンクラベル</a> となっていた場合、"url"と"リンクラベル"を自動的に抜き出して それを外部ファイルなどに出力してくれるソフトです。 自分で調べた中で近いソフトがあったのですが、どうも思ったような結果が得られなかったです。 http://www.forest.impress.co.jp/article/2005/06/17/ablink.html よろしくお願いします。

みんなの回答

回答No.3

たくさんのページを まとめて処理するような時は 別の方法もあります 補足してください 下記の文をコピーして メモ帳に貼り付けて TAG.vbs という名前で デスクトップに保存 ダブルクリックでこれを開いて URLを指定 CSVファイルが作成されて 終了メッセージが表示されたら CSVの内容を確認する myURL = InputBox("調べるURL", "Aタグ抽出", "http://www.yahoo.co.jp/") If myURL = "" Then Msgbox "Cancel(終了)" WScript.Quit End If myTM = Year(Now) & "_" & Month(Now) & "_" & Day(Now) & "_" myTM = myTM & Hour(Now) & "_" & Minute(Now) & "_" & Second(Now) myPATH = Replace(wscript.ScriptFullName, wscript.ScriptName, "") & "\" Set myFS = CreateObject("Scripting.FileSystemObject") Set myWF = myFS.CreateTextFile(myPATH & myTM & "_TAG_A.csv") Set myIE = CreateObject("InternetExplorer.Application") myIE.Visible = True myIE.Navigate myURL Do Until myIE.Busy = False 'DoEvents Loop For Each myTAG In myIE.Document.getElementsByTagName("a") myWF.WriteLine myTAG.innerText & "," & myTAG.Href Next myWF.Close : Set myWF = Nothing : Set myFS = Nothing myIE.Quit : Set myIE = Nothing MsgBox myPATH & myTM & "_TAG_A.csv を作成しました"

nodoamec
質問者

お礼

anotheroneさん、どうもありがとうございます。 早速試させていただいたのですが、どちらもエラーがでてしまいます…。 ATAGCHU.vbsの方はURL入力後、IEで指定のページが開き以下のメッセージが出ます。 行:21 文字:5 エラー:エラーを特定できません コード:80004005 ソース:(null) TAG.vbsの方は起動と同時にエラーメッセージが以下のように表示されます。 行:1 文字:64 エラー:文字が正しくありません コード:800A0408 ソースMicrosoft VBScriptコンパイルエラー ATAGCHU.vbsの方は何度か試してるうちに一度だけ出力が成功したんですが、その後は何度やっても同じエラーが出てしまいます。 TAG.vbsは保存時の警告メッセージとしてunicodeでの保存を促されましたがそれでよろしいのでしょうか? また、当方IE6、Excell2003を使用していますがそれは関係ありますでしょうか? お手数お掛けしますがどうぞよろしくお願いします。

関連するQ&A

  • <a href>タグ内のURL抽出

    正規表現初心者です。ご教授よろしくお願いします。 <a href=http://hoge.com/hoge>hoge</a> <a href=http://hoge.com/hoge>hoge<br>hoge</a> 以上の<a href>リンクから、それぞれURLだけを抽出したいのですが うまくできません。 ereg("<a href=(.+)>(.+)</a>",$hoge,$a); echo $a[1]; で、1つ目はURL抽出できたのですが 2つ目のように<br>があると『 http://hoge.com>hoge 』と表示されてしまいます。 このような場合、どのようにして抽出すればよいのでしょうか??

    • ベストアンサー
    • PHP
  • リンクのラベルを取得したい

    教えてください。 <a href="リンクしたいページのURL#ラベル名">リンク文字列</a> このような書き方がありますよね。 リンク先で、#以下のラベルを取得したいのですが どうすればいいのでしょうか? $_GETでは取得できなかったのですが・・・。 ラベルにより、いろいろ処理を分けたいのです。 よろしくお願いします。

    • ベストアンサー
    • PHP
  • 一つの行にURLが複数ある場合の、URL抽出方法は?

    htmファイルの中から、リンクされたURL情報を抽出するのが今回の目的です。 ご相談したいのは、URL情報が一つの行中に複数ある場合の抽出方法です。 ちなみに「一つの行にある<a href>リンクが一つだけ」の場合ですと、正規表現 <a +href=('|\").*('|\") *> でURLデータを正しく抽出できるところまで来ています。 ですが一つの行にある<a href>リンクが2つ以上あった場合は、最長一致のルールに従って、うまく抽出できません。 具体的に申し上げると、 ケース1:<a href="www.hoge.htm">ほげ</a> <a href="www.hoge.htm"> が抽出できる。 ケース2:<a href="www.hoge.htm">ほげ</a><a href="www.hogehoge.htm">ほげほげ</a> <a href="www.hoge.htm">ほげ</a><a href="www.hogehoge.htm"> が抽出される。(本当は2つを別々に取り出したい)

  • VBAでWEBページのURL抽出について

    エクセルのVBAにおいてWEBページのURLを抽出するマクロを考えております。 具体的に言うと、下記のようなwebページのタグがある中でhrefで参照しているURLを抽出したいと考えております。 <a class="" href="">あいうえお</a> GetelementByClassNameを使うことで文言の抽出はできるのですが、リンク先の抽出はできないのでしょうか?

  • URLに自動的にリンクをはってHTMLにできるエディタとかソフト探してます

    同一のパターンが延々と続く膨大なMSワードの資料があります。 まずサイトのタイトルがあって、次の行にURLが記載されています。 (それが2000セットくらい続きます。) で、その記載されただけでリンクは貼られていないURLから、 実際にリンクを貼って、それをHTMLファイルとして保存する、 という、手作業だとまちがいなく腱鞘炎になるであろう作業に 迫られています。 そこで、たとえばwww.~を自動的にURLと認識してくれて、自動的 にリンクを貼ってくれるエディター(ウェブにアップしなければ ならないのでHTML化できないとだめなのですが)とかソフトがあ りましたら、教えていただけないでしょうか。 もちろん、そのほかでも賢者のアイデアがあれば、、、。 どうぞよろしくお願いいたします。

  • URLの抽出できるソフトありますか?

    一枚のホームページに画像がいくつもあったとします。画像にはリンクがしてありクリックすると各ページに飛ぶ仕組みになっています。 画像のURLとリンク先のURLと各ページのタイトルをエクセルに入力していますが、数があり結構しんどいです。 なにかフリーソフトで簡単に抽出できるものはないでしょうか? よろしくお願いします。

  • URL抽出

    指定したURLのソースから<A HREF="~">タグの"~"部分を抜き出してリスト化するようなURL抽出ツールを作りたいのですが、どのようにプログラムを書けばよいのかわからずに困っています。 わかるかた、回答のほどをよろしくお願いします。

  • URLを貼り付けたら自動的にHTML化してくれるソフト

    Web制作ソフトを使ったり自力で入力しなくても たとえば、(ノートパッドの様な)軽いエディタで、URLを貼り付けただけで 自動的にHTMLで挟んで表示してくれる様な ソフトってありませんでしょうか…? 例 http://www.okweb.ne.jp/ これを貼ると自動的に↓こう表記される <a href="http://www.okweb.ne.jp/" target="_blank">http://www.okweb.ne.jp/</a> こんなカンジに…(topでも良いのですが) ようは、3・4工程を1工程ですませたいという横着な願いなのですが(笑) もしありましたら教えてやって下さい。

  • エクセルVBAにてURLの抽出

    エクセルVBAのマクロを用いてテキスト(ソースコード)よりURLを取得したいと考えています。 <a href="**"> 左記の「**」を取得し、エクセル上に 一覧として出力するものを想定しています。 なお、ソース上にhrefのコードは複数存在するので、 それら全てを出力したいのです。 以下が出力希望例になります。 <a href="http://www.test.co.jp"> <script type="text/javascript"> <a href="http://www.test2.co.jp"> 出力結果 http://www.test.co.jp http://www.test2.co.jp 諸事情があり、テキストを読み込んでエクセル上に取得する形式でお願いしたいです。 すみませんが、よろしくお願いします。

  • URLからリンクを作成するには… HTMLタグ

    どの項目に質問して良いのか分からない為、 ここで質問させてもらいます。 表題の通り、下記の様なURLを貼り付けて HTMLタグに変換できるサイトがあったのですが、 どうしてもそのサイトを思い出せず、 プログラムの知識等も無い為、困っています。。。 ひとつのURLを変換してくれる所はあるのですが、 沢山のURLとなると検索等で探してみたのですが わかりませんでした。 その様なサイトをお知りの方、または 特別な知識を必要とせずに下記の様な工程が出来る 方法をお知りの方、ご教授下さい。 以下は無駄なリンクを避ける為にhを全角にしています。 変換前 http://aaaaaaaaaa.com/ http://bbbbbbbbbb.com/ 以下大量 変換後 <li><A href="http://aaaaaaaaaaaa.com/" target="_blank">http://aaaaaaaaaaaa.com/</A> 以下続く

専門家に質問してみよう