- 締切済み
HTMLのparserを探しています。
HTMLのparserを探しています。 XMLのパーサーはかなり見つけたのですが、HTMLのパーサーがなかなか見つかりません。 できれば、フリーのものがいいのですが、 この際、どちらでもいいです。 お願いします。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- shigatsu
- ベストアンサー率26% (511/1924)
関連するQ&A
- C++: HTMLパーサを探しています。
C++のHTMLパーサライブラリを御存じの方がおられましたら、教えて頂けませんでしょうか。 XMLパーサはちらほら見つかるのですが、HTMLの解析ができるものを探しております。 PerlモジュールのHTML::TreeBuilderのようなtree構造の解析までできるものが理想です。 宜しくお願いいたします。
- ベストアンサー
- C・C++・C#
- HTML::Parserの解析結果
HTML::Parserを使ってHTMLからimgタグを抽出しようとしています。 http://homepage3.nifty.com/hippo2000/perltips/html/Parser.htm などの解説どおりに書けばimgタグの各項目を取り出すことは出来るのですが結果を配列で取得することができません。 解析したいHTMLを渡すことでimgタグの各情報を配列で受け取るには堂書けばいいのか教えてください。 HTML::TokeParserも試してみましたがまれに正しく抽出できない場合があり使えませんでした。 同じHTMLをHTML::Parserで解析したところ全て正しく抽出できたのでHTML::Parserで処理したいと考えています。
- 締切済み
- Perl
- XML::Parser::Expat が無い?
RSSフィードを読むCGIを作りたいと考えています。 XML::RSSを入れると、 ・XML/Parser.pm ・XML/Parser/Expat.pm が無いというエラーになったので入れました。 が、今度は、 「Can't locate loadable object for module XML::Parser::Expat」 というエラーになりました。 「XML::Parser::Expat」は、Expat.pm内にあるのに何故でしょうか? ちなみにperl5.005で、pmは全てCPANから落としました。
- ベストアンサー
- Perl
- XMLパーサを紹介してください。
VisualStudio2003でアプリを開発しています。 C或いはC++から利用できるXMLパーサを探しているのですが .NETやMFCを利用せず お手軽で軽量なXMLパーサをご存知ないでしょうか? 機能は単純なもので構いません。
- ベストアンサー
- C・C++・C#
- XMLパーサの種類について混乱してます
XSLTをいじる必要に駆られて、現在Java1.4+JAXP1.1を利用しています。 いままで、javax.xml.transformをimportしてメソッドを実行するだけで、「変換系に何を使っているのか」については全く気にしていなかったのですが、その実体は何なのでしょうか? (XTとかXalanとか、単体の変換系がありますよね・・・?) また、DOMパーサ、SAXパーサもJAXPで使えますが、各々のパーサや変換系を集めてパッケージにしたものがJAXPなんでしょうか。 さらに、勉強中にXMLパーサという単語が出てきて混乱しています。XMLパーサは、DOM・SAX・XSLT等とは違うのでしょうか? (XMLパーサと名乗っているXercesは何に使うのでしょうか・・・) DTDとの関連も含めて解説して頂けたら嬉しいです。
- ベストアンサー
- Java
- C#で使用できるHTMLパーサを探しています。
度々お世話になります。 表題の通り、C#用のパーサを探しています。 自分でも探してはおりますが、少し古いものだと HTML5に対応しているのかどうか等が不安になります。 dll、ソースレベル、どちらでも構いません。 おすすめなものがありましたら、教えてください。 よろしくお願いします。
- ベストアンサー
- C・C++・C#
- HTML::Parserの挙動がよく分かりません
CGIプログラミング第2版を読みながらCGIを学習しています。 11章 "ステートの保持"の11.1 クエリ文字列とパス情報の例題ではまっております。。。 これはURLに識別子を埋め込んでユーザーを追跡するという、超ハイテクなスクリプトです。 とりあえず、記載されているとおりにスクリプトを作成してHTMLファイルも用意しました。 HTMLファイルの内容は超簡単で <HTML><HEAD><TITLE>store</TITLE></HEAD><BODY><A href="abc.html">abc</A></BODY></HTML> です。 これでユーザーがhttp://ウェブサーバー/store/下のファイルをリクエストすると、自動的にスクリプトが実行され、カスタマイズされたHTMLファイルが返されるという仕様です。 実際に返されたHTMLファイルを見てみると <HTML><HEAD><TITLE>store</title></head><BODY> なんと<A>タグ以降がばっさり切り落とされていました^^ しかもタグは全部大文字で書いたのに一部小文字になっていたりと、意味不明な状況です。 たぶんHTML::Parserなるものが、いろいろHTMLファイルを操作しているとは思うのですが、今回返されたHTMLはどう見ても壊れているような・・・。
- ベストアンサー
- Perl
- HTML DOM Parserで取得できない
PHP Simple HTML DOM Parserでスクレイピングをしているのですが、 $row = <<<EOF <a href="http://yahoo.co.jp">yahoo</a> EOF; $row = str_get_html($row); echo $row; // 表示される echo $row->href; // 表示されない 上記の表示されない部分はどうやったらできますでしょうか? よろしくお願いします。
- ベストアンサー
- PHP
- C言語から呼び出し可能なXMLパーサについて
このたび、XMLで記述されたファイルを読み込んで、 特定のデータのみを取り出すことになりました。 それで、XMLパーサを使用してそれを実現しようかと 思っています。C言語から呼び出し可能なXMLパーサがあれば、教えていただけませんでしょうか。(有償でも無償でもかまいません。実行時のOSはSparc系solarisですが、linux,windowsで使用可能なものでもかまいません。参考にしたいと思っています) JAVAからの呼び出し可能なものであれば、あるようですが、C言語から呼びさせるものは、検索しても見あたりませんでした。
- ベストアンサー
- C・C++・C#
- ソースネクスト株式会社製品のシリアル番号についてお困りの方へ
- マイページからシリアル番号が確認できなくなった場合の対処方法
- ソースネクスト株式会社製品の新規登録時にシリアル番号が表示されない場合の解決策