• ベストアンサー

C++: HTMLパーサを探しています。

C++のHTMLパーサライブラリを御存じの方がおられましたら、教えて頂けませんでしょうか。 XMLパーサはちらほら見つかるのですが、HTMLの解析ができるものを探しております。 PerlモジュールのHTML::TreeBuilderのようなtree構造の解析までできるものが理想です。 宜しくお願いいたします。

noname#9431
noname#9431

質問者が選んだベストアンサー

  • ベストアンサー
  • nitscape
  • ベストアンサー率30% (275/909)
回答No.1

プラットフォームがWindowsでしたらIEコンポーネント(mshtml)を利用してはどうでしょうか?

noname#9431
質問者

お礼

ご回答ありがとうございます。 教えて頂いたmshtmlを少し調べてみましたが、便利そうですね。VC++は使ったことがないのですが、ライブラリが充実しているようなので、いろいろと手軽に遊べそうですね。(ネットワーク関連はどうしても、プラットフォーム依存になってしまうのはしかた ないのかもしれませんね。)VC++で使える便利なネットワーク関連ライブラリがあるとい う点、とても参考になりました。 どうもありがとうございました。

noname#9431
質問者

補足

環境はできれば非依存でと考えております。 汎用ライブラリの上で使用するものでもよいです。 boostには構文解析のライブラリが確かあったと思うので、だれかHTMLパーサを作ってい てもおかしくないかな? と思いまして質問させて頂きました。

関連するQ&A

  • HTMLのparserを探しています。

    HTMLのparserを探しています。 XMLのパーサーはかなり見つけたのですが、HTMLのパーサーがなかなか見つかりません。 できれば、フリーのものがいいのですが、 この際、どちらでもいいです。 お願いします。

  • C/C++のRSSパーサ(ライブラリ)を教えてください

    CあるいはC++言語のRSSパーサ(ライブラリ)をご存知の方がいらっしゃいましたら、教えてください。

  • HTML::Parserの解析結果

    HTML::Parserを使ってHTMLからimgタグを抽出しようとしています。 http://homepage3.nifty.com/hippo2000/perltips/html/Parser.htm などの解説どおりに書けばimgタグの各項目を取り出すことは出来るのですが結果を配列で取得することができません。 解析したいHTMLを渡すことでimgタグの各情報を配列で受け取るには堂書けばいいのか教えてください。 HTML::TokeParserも試してみましたがまれに正しく抽出できない場合があり使えませんでした。 同じHTMLをHTML::Parserで解析したところ全て正しく抽出できたのでHTML::Parserで処理したいと考えています。

  • PHPでHTML, XMLのパース機能?

    よくHTMLやXMLをTree構造でParseする関数がPerlにあったりするのですが、PHP(Ver4.3)ではどのようにするのでしょうか?

    • ベストアンサー
    • PHP
  • C#で使用できるHTMLパーサを探しています。

    度々お世話になります。 表題の通り、C#用のパーサを探しています。 自分でも探してはおりますが、少し古いものだと HTML5に対応しているのかどうか等が不安になります。 dll、ソースレベル、どちらでも構いません。 おすすめなものがありましたら、教えてください。 よろしくお願いします。

  • XML::Parser::Expat が無い?

    RSSフィードを読むCGIを作りたいと考えています。 XML::RSSを入れると、 ・XML/Parser.pm ・XML/Parser/Expat.pm が無いというエラーになったので入れました。 が、今度は、 「Can't locate loadable object for module XML::Parser::Expat」 というエラーになりました。 「XML::Parser::Expat」は、Expat.pm内にあるのに何故でしょうか? ちなみにperl5.005で、pmは全てCPANから落としました。

    • ベストアンサー
    • Perl
  • XML::Parserの parsefileの結果はどんな値が正しいのでしょうか?

    PerlのXML::Parserモジュールで、Objectスタイルで パースをしようとしているのですが、 $docの値が1となり、パースの結果のデータ?は 帰ってこないのですが、何か問題があるのでしょうか? my $file = 'test.xml'; my $p = XML::Parser->new(Style=>'Object'); my $doc = $p->parsefile($file); print $doc; exit;

    • ベストアンサー
    • Perl
  • XMLパーサを紹介してください。

    VisualStudio2003でアプリを開発しています。 C或いはC++から利用できるXMLパーサを探しているのですが .NETやMFCを利用せず お手軽で軽量なXMLパーサをご存知ないでしょうか? 機能は単純なもので構いません。

  • C言語から呼び出し可能なXMLパーサについて

    このたび、XMLで記述されたファイルを読み込んで、 特定のデータのみを取り出すことになりました。 それで、XMLパーサを使用してそれを実現しようかと 思っています。C言語から呼び出し可能なXMLパーサがあれば、教えていただけませんでしょうか。(有償でも無償でもかまいません。実行時のOSはSparc系solarisですが、linux,windowsで使用可能なものでもかまいません。参考にしたいと思っています) JAVAからの呼び出し可能なものであれば、あるようですが、C言語から呼びさせるものは、検索しても見あたりませんでした。

  • JavaScriptパーサの入手方法

    Webページの解析をするためのHTMLパーサは作成できたのですが、JavaScriptパーサは難しく、悩んでいます。 JavaScriptパーサもわざわざ作成しなければいけないかと思うと、気が滅入りそうです。 かつて、Python言語処理系を作成した経験があるので、JavaScriptもできなくはないのですが、JavaScriptの処理系をどこかから入手できれば大変助かると思い、投稿しました。 JavaScriptパーサの入手先をご存知の方、よろしくお願いします。

専門家に質問してみよう