実行対象のブログのURLは抽出させない
以前の質問http://oshiete1.goo.ne.jp/kotaeru.php3?q=1725502
のご回答のプログラムを改良してトラックバックされたブログURLを抽出する
以下のようなプログラムを作成しました。
(省略部分は参考プログラムとほぼ同じ。)
class GetTBurlLivedoor {
public static String[] getTBaddrLivedoor(String urlString){
…
//ブログのURLを抽出。ただし、スペースの都合上ここではライブドアのみ抽出とする
//indexOfを用いての範囲指定はせず、HTMLすべてに対してパース
Pattern trackBack = Pattern.compile("http://blog.livedoor.jp/.*/archives/\\d+.html");
while((aLine = reader.readLine())!=null){
Matcher m = trackBack.matcher(aLine);
if(m.find()){
addr+=m.group(0)+",";
}
…
public static void main(String[] args){
String url = args[0];
//実行例 http://blog.livedoor.jp/takapon_ceo/archives/50030785.html
String[] TBaddr = getTBaddrLivedoor(url);
for(int i=0;i<TBaddr.length;i++)
System.out.println(TBaddr[i]);
}
}
そこで、URLを抽出する際に、実行対象となるブログ自身に関するURL
例)http://blog.livedoor.jp/takapon_ceo/archives/50034644.html
などは抽出しないようにするため、
そのブログ自身のIDを含むURLは抽出しないような処理をしたいと思います。
例えば、ライブドアでは、ブログのIDは、
http://blog.livedoor.jp/ ID /archives/50030785.html
となっているので、このID(実行例ではtakapon_ceo)を含むURLは抽出しないようにさせたいです。
このようにするには、どのようにプログラムを組めばよいでしょうか?
よろしくお願いします。