- 締切済み
複数のHTMLファイルの中身において、指定したタグ範囲の文字列をエクセ
複数のHTMLファイルの中身において、指定したタグ範囲の文字列をエクセルかCSVで抜き出すツールをご存じないでしょうか? 例: <tilte>~<tilte> <h2>~</h2> など、上記のようにタグで指定した範囲の文字列を抜き出したいと考えてます。 なお、対象となるHTMLファイルはローカルフォルダにあるので、パスを指定して ソースの中身を抜き出すイメージです。 よろしくお願い致します。
- みんなの回答 (2)
- 専門家の回答
関連するQ&A
- HTMLタグの中味抽出
HTMLのタグの中味を抽出する正規表現として、以下の形を学びました。 [^<]+?(?=>) この正規表現で以下のHTML文を処理すると、 <tag_nakami_1><tag_nakami_2>title_text</tag_nakami_1></tag_nakami_2> 以下の結果が出ました。 tag_nakami_1 tag_nakami_2 /tag_nakami_1 /tag_nakami_2 ですが、なぜ、「title_text」の部分がうまく取り除かれたのかがわかりません。 <tag_nakami_1><tag_nakami_2> まで処理がすんで、次は title_text</tag_nakami_1> が処理対象の文字列となるのでは無いでしょうか?その場合、末尾の > より前の部分、title_text</tag_nakami_1 から < のみが除かれた文字列、title_text/tag_nakami_1 が抽出される、つまり以下のような結果が出そうに思えます。 tag_nakami_1 tag_nakami_2 title_text/tag_nakami_1 /tag_nakami_2 ですが実際はそうなりません。 これはなぜなのでしょうか……。
- ベストアンサー
- その他(プログラミング・開発)
- HTMLのinputタグに入力された文字列の中にHTMLのタグが
HTMLのinputタグに入力された文字列の中にHTMLのタグが 含まれたらjavascriptでalertを出すようにしたいのですが、 どのようにしたらよいかお分かりの方いましたら、 どうか教えてください。 お願いいたします。
- ベストアンサー
- JavaScript
- logファイルの中身を検索し、指定の文字列を取り込む
Dosプロンプトバッチについてお聞きします。 ファイルの中身を確認し、指定の文字列を取り込んでそれを保存するバッチうを作りたいのですが、可能でしょうか。 どなたか分かる方よろしくお願いします。
- 締切済み
- その他(プログラミング・開発)
- 複数のファイルからの文字列の抜き出し方について教えて下さい。
VBAとC言語の基本的なことは分かりますが、VBAは昔少しだけやっただけでほとんど分かりません。 100個くらいあるHtmlファイルから指定した行に書かれている文字列をコピーしてそのHtmlファイルの名前を自動で書き換えてくれるプログラムを作りたいのですが、どのようにすれば良いのでしょうか? 100個も同時にファイルを開くと非常に重くなると思うので、順番に文字列を抽出するようなものの方が良いと思うのですが、 何から始めて良いのか分かりません。 VBの基本書を頭から順番に読むというのはいま時間がないので、基本的な手順だけ教えて頂けないでしょうか? よろしくお願い致します。
- ベストアンサー
- Visual Basic
- VLOOKUP 範囲の複数列指定
vlookupは指定範囲の左側だけを検索しますよね。 そこを、範囲を指定した場所全てを検索して、指定した列の文字を返すことはできますか?別に他の関数を併用した方法でもかまいません。
- ベストアンサー
- その他(インターネット・Webサービス)
- 秀丸で文字列範囲を選択したら、前後にタグ挿入したい
秀丸エディタで、文字列範囲を選択したら、前後に特定タグを挿入したいのですが、どうすればよいでしょうか? どこかにそんなマクロないでしょうか? あるいは、どうやって、そういうマクロを作ったらよいでしょうか? ―やりたいこと― この範囲の文字列を選択したら、前後にblockquoteタグをつけたい ↓ <blockquote>この範囲の文字列を選択したら、前後にblockquoteタグをつけたい</blockquote>
- ベストアンサー
- その他(プログラミング・開発)
- HTMLタグの内側の指定文字を削除
文字列中からHTMLタグの内側のダブルクォーテーションを削除したいのですが、どのようにすればできるでしょうか。 <FONT color="#000000"> → <FONT color=#000000> それと、\<[^\>]*\> と <[^>]*> と <.*?> はどのように違うのでしょうか。 ご教授よろしくお願いします。
- 締切済み
- Perl
- エクセルでHTMLファイルを文字列として記入したい
HTMLファイルをエクセルのセルにコピペしましたが ただの文字列にならず、画像や文字が表示されます。 エクセルは2003です 当該セルの書式を文字列と指定してもただの文字列になりませんでした。 エクセルは表計算以外に使用した事が無いので さっぱりわかりません。 どなたかご教示くださいませんか 宜しくお願いします。
- ベストアンサー
- その他MS Office製品
- VBAを使ってHTMLソースから特定の文字列を抽出したいと思っています
VBAを使ってHTMLソースから特定の文字列を抽出したいと思っています。 正規表現を利用してタグに挟まれた文字を抽出したいのですがうまくいきません。 タグごと抽出する方法でも構わないので教えてください。 例えば <a href="www.yahoo.com△">○○○</a> ・・・<1> ※△は(www.yahoo.com)+(半角数字1文字) ※○○○は1文字以上の全角文字 このようなパターンの文字列(<1>を丸ごと)を抜き出すには どのような正規表現を書けばよいでしょうか? 単に<a href ではじまって </a> で終わる文字列であれば <a href.*</a> で良いと思うのですが、もう少し範囲を絞れば目的の文字列だけを抽出できるので ぜひ実現させたいと思っています。宜しくお願いします。
- ベストアンサー
- Visual Basic
- 複数のファイル 改行が入った文字列の一括変換
改行が入って複数行にわたる文字列を 複数のファイルを対象にして 一括変換するツールは ありませんでしょうか。 一行だけの文字列では 「ファイルから置換」を使っているのですが、 複数行を対象にした置換をする方法がわからないのです。
- ベストアンサー
- その他([技術者向] コンピューター)
- ぷららwebメールの送信取り消しを急ぎ行いたいです。可能でしょうか?
- 急いでぷららwebメールの送信を取り消したいです。お願いできますか?
- ぷららwebメールの送信を速やかにキャンセルしたいです。ご協力お願いします。
お礼
そんなに便利なものだったんですね。。 遠回りですが、身に付けて損はないと思いますので勉強したいと思います。 良いキッカケを与えていただきありがとうございました。