-PR-
締切済み

BCBで使えるHTMLパーサー、リンクの抽出

  • 困ってます
  • 質問No.98838
  • 閲覧数296
  • ありがとう数2
  • 気になる数0
  • 回答数1
  • コメント数0

お礼率 60% (3/5)

Borland C++Builderで使えるHTMLパーサーのVCLを探しています。海外では、THTMLParserなどを検索語にして調べると幾つかありましたが日本語が文字化けしたりして、調子よくありません。

http://www.dallas.net/~richardp/delphi/components/home.html

日本語の通るフリーのHTMLパーサーのVCLというのはご存知でしょうか。

また、実際にやりたいのは、ページから、

・<TITLE>タグで囲まれたタイトルの抽出
・<A HREF = URL>リンク文字列</A>
 の、URL部分とリンク文字列のリストを得る

ということなのですが、私の拙い知識では何度やってもうまく取り出すことができません。それでVCLでできないかなあと調子の良いことを考えています。こういった文字列解析の定石のようなコーディングはあるのでしょうか。

質問ばかりですみません。ご存知の方よろしくお願いいたします。
通報する
  • 回答数1
  • 気になる
    質問をブックマークします。
    マイページでまとめて確認できます。

回答 (全1件)

  • 回答No.1
レベル8

ベストアンサー率 44% (11/25)

私も似たようなものを探していました。
VCLではありませんが、ANSI C++/ライブラリで書かれているHTMLパーサライブラリがデジリニアのページで公開されているのでご参考にされてはいかがでしょう。
私もダウンロードしただけでまだ試していないため何ができるのかまでは把握しておりません。すいません(^_^;

URLのページのダウンロードのところにあります。
お礼コメント
Blogger

お礼率 60% (3/5)

ご紹介ありがとうございました。
それからいろいろ苦労しましたが結局、パーサを自作して目的を遂げました。CppWebBrowserにQueryInterfaceしてiHTMLDocument2オブジェクトからソースを取り出すという方法もその後見つけました。しかし、BCBでCOM操作は複雑になりがちでまだ勉強中です。
投稿日時 - 2001-07-23 16:48:25


このQ&Aのテーマ
このQ&Aで解決しましたか?
AIエージェント「あい」

こんにちは。AIエージェントの「あい」です。
あなたの悩みに、OKWAVE 3,500万件のQ&Aを分析して最適な回答をご提案します。

関連するQ&A
-PR-
-PR-
こんな書き方もあるよ!この情報は知ってる?あなたの知識を教えて!
このQ&Aにはまだコメントがありません。
あなたの思ったこと、知っていることをここにコメントしてみましょう。

その他の関連するQ&A、テーマをキーワードで探す

キーワードでQ&A、テーマを検索する
-PR-
-PR-
-PR-

特集


専門家があなたの悩みに回答!

-PR-

ピックアップ

-PR-
ページ先頭へ