Perl スクレイピング処理について
以下のような構成のページから、前半2つの twitter ,facebook のみを
process '#share_item ul li', 't_url' => '@href';
のような形で抜き出したいのですが、
これだとtwitterからmixi までの情報を一気に取得してしまいます。
process '#share_item ul li', 'twi_url' => '@href';
process '#share_item ul li', 'fb_url' => '@href';
のように、それぞれ分けて取得するよい方法はありますでしょうか?
----------(ここから)---------
<div id="share_item">
<ul>
<li>
<a href="http://twitter.com/share?text=(略)&via=test_mk" target="_blank" onclick="s_omni.trackSNS('twitter')">
<img src="http://aaa.com/btn1.gif" alt="twitterでつぶやく" />
</a>
</li>
<li>
<a href="http://www.facebook.com/share.php?u=http://aaa.com/" target="_blank" onclick="s_omni.trackSNS('facebook')"><img src="http://www.aaa.com/common/btn2.gif" alt="facebookでシェア" /></a>
</li>
<li>
<a href="mailto:?subject=
~(略)~alt="
メールで知らせる" />
</a>
</li>
<li>
<a href="http://mixi.jp/recent_voice.pl?from=home_profile" target="_blank" onclick="s_omni.trackSNS('mixi')">
<img src="http://aaa.com/btn4.gif" alt="mixiで知らせる" /></a>
</li>
<li>
<link rel="mixi-check-image" type="image/jpeg" href="http://aaa.com//img/site/3.jpg" />
<a href="javascript:void(0);" onclick="window.open('http://mixi.jp/share.pl?u=http://aaa.com/&k=cf6870bacc04932deb167c0ee0483894cf74249b','share',['width=632','height=456','location=yes','resizable=yes','toolbar=no','menubar=no','scrollbars=no','status=no'].join(','));"><img src="http://aaa.com/btn5.gif" alt="mixiチェック"></a>
</li>
</ul>
</div>
----------(ここまで)---------
(2)これは補足的な質問なのですが、
「#share_item ul li」
のように # がつく記述と付かないパターンがあるのですが、
この違い(#が必要な時)が不明です。
ご存知の方、教えて頂ければ幸いです。
お礼
変な書き込みで外野が煩くなる現象ですが、僕は国外の経済誌でしか情報を摂っていないので、誰かが何を言ってももはや知りようがないのですね。皆そうすればいいのにと常日頃思っているのですが。 環境設定を最近よく考えていて、世俗レベルの世論はイナゴの大群なのですが、自分が見なければいいだけの話です。相手を引きずり込むのであれば、email などチャンネルは一個に絞り、こちらから仕掛けてそこに持ってゆくことです。フワッとした空気のような感情でウェブの言論は動いているので、戦略があればいくらでも自分の気に入らない相手を法的に糾弾出来ると思いますよ。お金は必要ですが。 話がズレましたが、ご回答ありがとうございました。