• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ブログのHTMLからtrackback:pingの抽出(HTMLにrdf要素がないブログ))

ブログのHTMLからtrackback:pingの抽出(HTMLにrdf要素がないブログ)

このQ&Aのポイント
  • ブログのHTMLからtrackback:pingを抽出する方法について説明します。
  • 一般的なブログでは、trackback ping URLはrdf:Description要素の中に記述されていますが、一部のブログでは異なる方法で記述されています。
  • 具体的には、ヤプログやドリコムブログなどではrdf:Description要素が存在せず、trackback ping URLが直接HTML内に記述されています。プログラムを組んでこのURLを抽出することができます。

質問者が選んだベストアンサー

  • ベストアンサー
  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.1

ドリコムの場合、パターンマッチングを以下のようにすればいいかも・ (ヤプログは、現在メンテナンス中でテストできませんでしたが同じでいけるかと) あとは、WEBサイトの切り分けをURLからやればいいと思います。 ---------------------------------------------------------------- trackBackPing = Pattern.compile("http:.*\\/tb_ping\\/\\d+"); m = trackBackPing.matcher(aLine); if(m.find()){ addr=aLine.substring(m.start(),m.end()); break; }

shows
質問者

お礼

ご回答ありがとうございます。 現在はプログラムを実行できる環境にいないので、 プログラムを動作させるまで評価の方はもうしばらくお待ちください。 ありがとうございました。

shows
質問者

補足

プログラムを動作させました。 無事TrackBackPingURLを抽出できました。 ありがとうございました。

関連するQ&A

専門家に質問してみよう