• 締切済み

vb2005でhtmlからテキストのみを抽出したい

vb2005でhtmlからテキストのみを抽出したリストを取得しようと考えています。 下記を参照してhtmlそのままのデータは取得出来たのですが、その他色々調べてもテキストの取得がわかりません。 http://www.atmarkit.co.jp/fdotnet/dotnettips/311webreqres/webreqres.html 上記urlの方法以外でも構いませんので、テキストの取得方法を教えてください。

noname#249046
noname#249046

みんなの回答

  • todo36
  • ベストアンサー率58% (728/1234)
回答No.1

System.Windows.Forms.WebBrowserに読み込ませて、.Document.Body.InnerText でテキストを取得できるでしょう。 http://www.atmarkit.co.jp/fdotnet/dotnettips/687nondispbrowser/nondispbrowser.html または、WebBrowserを使わずにHTML解析を行う方法 http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=45032&forum=7&5

noname#249046
質問者

お礼

ありがとうございます。 しかし、System.Windows.Formsが無いようで Imports System.Windows.Forms でエラーが出てしまいました。 具体的にやりたいことは下記の様なイメージです。 テキストを一行ずつ処理したいのですが、 取得方法はどのようになるかわかりますでしょうか。 ----------------------------------------------- Module Module1 Sub Main() 'ここから下がわからない このhtmlのテキストorドキュメント?を取得 = http://www.google.co.jp/search?source=ig&hl=ja&rlz=&q=%E3%83%86%E3%82%B9%E3%83%88&btnG=Google+%E6%A4%9C%E7%B4%A2&meta= 'ここから上がわからない for each xxx このhtmlのテキストorドキュメント?を取得 Console.Write("AAA" & xxx & vbCrLf) Next End Sub End Module

関連するQ&A

  • はじめまして

    はじめまして VBを勉強し始めたものです。 下記のリンクのソフトをVB2010で動かしてみたのですが フォームが表示されるのみで実行結果が出てきません。 Win7、VB2010でインターネットには接続できます。 すみませんが、詳しい方教えてください。 http://www.atmarkit.co.jp/fdotnet/dotnettips/687nondispbrowser/nondispbrowser.html やりたいことはhtmlのタグを抽出したいのですが、まったくできなく 進まない状況です。

  • VBによるExcelのデータ抽出について

    初歩的なことで困っています。下記質問の内容で教えていただけたら助かります。 開発環境は、VB.NET(2003)、Office2003、OS XPです。 複数のエクセルシートのデータを抽出したく、下記URLを参考にして、データ抽出用のモジュールを一つ作成し、(殆どURLのまま:シート名を引数で渡すぐらいの変更)、データを抽出する度に、このモジュールが呼ばれるようなプログラムになっています。 実際に、動作させると2回目の抽出時(2回目を呼び出した時)に「Fill」の部分で下記エラーが表示されます(1回目は正常に抽出できます)。 いろいろ調べても解決できず、困っています。何か良いアドバイスがあれば、宜しく御願いします。 Error: 「System.NullReferenceException' のハンドルされていない例外が 不明なモジュールです。 で発生しました。 追加情報 : オブジェクト参照がオブジェクト インスタンスに設定されていません。」 OKボタン押下で「現在の場所のソースコードを表示できません。」と表示。 URL: http://msdn.microsoft.com/library/ja/default.asp?url=/library/ja/dv_vbcode/html/vbtskcodeexamplereadingexceldataintodataset.asp

  • Microsoft Visual Basic 6.0のテキストエディッタについて

    VB6のテキストエディッタで行番号を表示することはできるのでしょうか? VB.NETだとできるみたいなのですが、VB6でのやり方がわかりません。 下記みたいにVB6でもしたいです。 参考:http://www.atmarkit.co.jp/fdotnet/dotnettips/380linenumber/linenumber.html よろしくお願いいたします。

  • VBを使い、テキストをする保存について

    VBで、あるデータを取得したテキストを保存する際に「テストyyyyMMdd.txt」と日付を保存名に入れて保存したいのですが、この場合の方法が解りません。ご教授お願いします。

  • VBで抽出したデータの中に値が入っていない時、"0"を代入したいのです

    VBで抽出したデータの中に値が入っていない時、"0"を代入したいのです。 例えば、下記の様な外部テキストの一部を抽出した時に、 データが入っていない所は、"0"を入れたいのです。 A B C D 2,445,8,100 1,445,,100 3,445,9,100 ↓ 変数i=Cとして、 8,データ無し,9が抽出された時に、このデータ無しの部分に"0"を入れたいです。 2日間調べても解りませんでした。 どなたか、解る方居ましたら教えてください。 よろしくお願いいたします。

  • PDFそのものから、テキストの抽出

    PDFそのものから、テキストの抽出は可能ですか? Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。 ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか? 逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

  • VB6 複数行のテキストをリストへ出力

    VB6 でTextBoxのMultiLineをTrueにして複数行にしてあります。 このテキストのデータをリストへ表示させたいのですが、方法が分かりません。 コマンドクリックイベントへ試しに List1.AddItem Text1.Lines(0) などやってみたのですがエラーしてしまします。 LinesはVB6では使用できないのでしょうか?? ご教授願います。

  • 自動巡回+一部のテキストを抽出するソフト探しています

    ホームページのデータを収集してEXCELで表にしたいのですが、 ホームページのURLおよびHTMLソースは一定しているものの、 収集したいデータは数百ページもあり、いちいちソースを開いて、 探して抽出するのは非常に非効率で、途方にくれています。 一定の連番の持つURL(予め用意したURLリスト)を自動巡回して、 HTML内の一部のテキスト(行指定して1行~数行)を抽出するソフト探しています。 もちろんHTMLソースが一定の法則になっています。 (htmlタグは変わらないが、テキストとURLだけは違う・・・) 例えば、  http://www.***.com/data/1255.html  http://www.***.com/data/1256.html  http://www.***.com/data/1428.html のようにURLは一定していること。 個別のHTMLソースでは例えば、 18行目の・・・ 『 <td width="100"><b><font size="-1">●●●●</font></b></td>』  の●●●●だけを抽出するとか・・・  これをCSVやウェブでテキストベースで表示できれば幸いです。 そのようなソフトはございますか? よろしくお願いします。

  • VB6のListの使い方

    VB6でListを使っています。 最初、Listに複数のデータが入っています。 何かデータを取得したら、、Listの該当するところのデータを変えていきたいのですが、できますか? Additemで項目の追加はしたことがありますが、変更の仕方が分かりません。 ただし、最初にあるデータはそのままで変わったところだけ変更していきたいです。

  • EBCDICへの変換

    VB.NETまたは、C#.NETでのEBCDIC(漢字)→SJISへの 変換は可能でしょうか? 下記ページは一度拝見しましたが、IBM EBCDIC (日本語カタカナ) しか無いようでです。 http://www.atmarkit.co.jp/fdotnet/dotnettips/013enumenc/enumenc.html 自分で作る以外だと、ミドルウェアに頼るしかないのでしょうか? よろしくお願いします。

専門家に質問してみよう