XML::XPathでのタグの取り出し

2006/10/10 20:40

このQ&Aのポイント

perlでXMLをHTMLとTEXTに変換するために、XPathを使用して同じタグの取り出しを試みていますが、うまくいきません。具体的には、<name>タグの中身を個別に取得したいのですが、どうすればよいでしょうか？
perlの初心者ですが、XMLをHTMLとTEXTに変換するためにXPathを使用しています。しかし、同じタグの値を個別に取り出す方法が分かりません。特に<name>タグの値を取得したいのですが、どうすれば良いのでしょうか？
perlでXMLをHTMLとTEXTに変換するためにXPathを使用していますが、<name>タグの値を個別に取得する方法が分かりません。どのようにすれば、<name>タグの中身を取得できるのでしょうか？お知恵をお貸しいただけると幸いです。

tako-kani
お礼率88% (16/18)

Perl
回答数4
ありがとう数5

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

BLUEPIXY
ベストアンサー率50% (3003/5914)

2006/10/11 20:15 回答No.3

#2> まず指定されたXML にルートがありません。＞if($xpath->exists($jou){ 閉じカッコがありません。＞print "$xpath->findvalue($jou)\n"; のように全体を"" でくくったらちゃんと動作しないはずです。 print $xpath->findvalue($jou),"\n"; のような感じに修正下さい。＞print "$xpath->find('//jouhou/inigoukei/goutokuten')->get_node(1)\n"; 指定したパスが違っています。そういう点を修正したものとして回答させていただくと my $node= $xpath->find('//jouhou/goukei/goutokuten')->get_node(1); の様にノードを取り出したらノードのテキストを取り出すには $node->string_value のようにします。分けないで $xpath->find('//jouhou/goukei/goutokuten')->get_node(1)->string_value の様にしても良いです。ちなみに、＃２のＸＭＬの様な場合はパス指定を my $path = "//jouhou[1]/goukei/goutokuten"; のようにすれば $xpath->findvalue($path) あるいは、 $xpath->getNodeText($path) で同じデータが取り出せます。質問文のように my $path = "//jouhou/goukei/goutokuten[1]"; と指定したら、 //jouhou/goukeiの下にあるたくさんあるgoutokuten の最初という意味になって find では、 <goutokuten>３</goutokuten>←あるノード配下の最初のgoutokuten <goutokuten>４</goutokuten>←また別のノード配下の最初のgoutokuten が該当するリストということになります。

質問者

お礼 2006/10/12 12:17

親切な回答ありがとうございます。今度はうまくいきました！！

質問者

補足 2006/10/12 15:21

大変お世話になりまして、ありがとうございます。申し訳ございませんが、もう１つだけ質問させいただきたいのですが…。もしルール違反なら、新しい質問としてあらためてさせていただきます。 ---------------------------------------------------  <root> <ten kai="1回">０</ten> <ten kai="2回">０</ten> <ten kai="3回">２</ten> <ten kai="4回">１</ten> ：  </root> --------------------------------------------------- このときの属性の"1回"を取得したいのですが、うまくいきません。 $xpath = new XML::XPath( filename => "tensuu.xml" ); #--(1)-- print $xpath->find('/root/ten/\@kai')->get_node(1)->string_value; #--(2)-- my $path = "//root/ten/\@kai[1]"; print $xpath->findvalue($path); タグと同じように試してみたのですがどちらでもエラーも出なく、無視された感じになりました。ソースを見ると、これ以降の「 print "</p>"; 」なども出てきていません。お手数をお掛けしますが、よければ教えていただきたいです。よろしくお願いします。

その他の回答 (3)

BLUEPIXY
ベストアンサー率50% (3003/5914)

2006/10/12 17:20 回答No.4

#3>もしルール違反なら、新しい質問としてあらためてさせていただきます。おそらく、ルール違反と言うよりマナー違反 #3>このときの属性の"1回"を取得したいのですが、うまくいきません。他にも指定の仕方はあると思いますが、＃３の場合は以下のような感じでイイかと思います。 #１番目のten の属性 kai の内容を取得する print $xpath->findvalue('/root/ten[1]/@kai'),"\n"; #属性 kai が "1回" であるノードのテキストを取得する print $xpath->findvalue('/root/ten[@kai="1回"]'),"\n";

質問者

お礼 2006/10/12 21:07

ルール違反をしたにもかかわらず、回答ありがとうございました。この方法でやってみます。お世話になりまして、本当に感謝します。ありがとうございました。

BLUEPIXY
ベストアンサー率50% (3003/5914)

2006/10/11 14:44 回答No.2

#1>XML::XPath::Node::Element=REF(0x1f116c4) と出てきてしまい… ＃１の回答は、ノードを取り出すものです。おそらく、表示するためのノードからのデータの取り出し方に問題がある（オブジェクトのままになっており、表示できるデータとして取り出せていない）と思います。よろしければ、ご使用の実際のソースを補足下さい。

質問者

お礼 2006/10/12 23:03

#4のお礼の続きです。（ルール違反でなくて）マナー違反をしたにもかかわらず、回答ありがとうございました。と、書きたかったのです…。間違えてしまったのでこちらに書かせていただきました。また、質問がありましたらよろしくお願いします。ありがとうございました。（BLUEPIXYさんが見てくれていると良いのですが。）

質問者

補足 2006/10/11 17:29

たびたび回答ありがとうございます。よろしくお願いします。 ------------------------------------------------------------------------- もとのXML文書です---data.xml <mei> <kyuujou>ドーム</kyuujou> </mei> <jouhou> <goukei> <goutokuten>３</goutokuten> </goukei> </jouhou> <jouhou> <goukei> <goutokuten>４</goutokuten> </goukei> </jouhou> ------------------------------------------------------------------------- $xpath = new XML::XPath( filename => "./data.xml" ); #XMLの中に1つしかないタグ<kyuujou>のときこれでやっていました。 my $jou = "//mei/kyuujou"; if($xpath->exists($jou){ print "$xpath->findvalue($jou)\n"; } #教えていただいたのをやってみたものです。すでに間違っているかもしれませんが…。 my $path = "//jouhou/goukei/goutokuten"; if($xpath->exists($path)){ print "$xpath->find('//jouhou/inigoukei/goutokuten')->get_node(1)\n"; } ------------------------------------------------------------------------- これを実行するとブラウザでは「　ドーム　XML::XPath::Node::Element=REF(0x1f039e4)　」と出てしまいました。大変申し訳ございませんが、よろしくお願いします。

BLUEPIXY
ベストアンサー率50% (3003/5914)

2006/10/11 03:34 回答No.1

my $node= $xp->find('/root/man/name')->get_node(1); で番号指定したノードを取り出せます。（※番号は０始まりでなく１始まり）

質問者

補足 2006/10/11 10:51

回答ありがとうございました。試したところ、ブラウザに XML::XPath::Node::Element=REF(0x1f116c4) と出てきてしまい、いろいろ試したのですがやはり出てきません。この場合、何が悪いのでしょうか？たびたび申し訳ございませんが、わかりましたらよろしくお願いします。

XML::XPathでのタグの取り出し

XML::XPathでのタグの取り出し