• ベストアンサー

htmlからテキストを取り出す方法

htmlの文書があります。ブラウザで見ると罫線が規則的な格子状になっており各セルに文字が入っています。結構大量です。 このような文字をテキストとしてマイクロソフトワードで取り出すにはどうしたらよいでしょうか。 ブラウザで読み込んでワード上にコピー・ペーストすると、罫線まで一緒にコピーされます。一方、直接ワード上にそのhtmlを読み込むと紙面からはみ出したところまで罫線が及ぶため非常に編集しにくく、また罫線も邪魔です。 この問題を解決するには、ワード上に読み込んだデータから罫線をきれいに消去すればよいと思うのですが、どうしたらよいでしょうか。該当する領域全体(文字・罫線)を選択して罫線を削除するような操作をすると、文字まで消えてしまいます。罫線だけを消してしまいたいのですが。また罫線は黒い線だけでなく、薄灰色の線も見えています。これも消したいのですが。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • hirorin00
  • ベストアンサー率50% (446/884)
回答No.1

はじめまして 貼り付ける際に、メニューの「編集」→「形式を選択して貼り付け」でテキストファイルを選択すればよいと思います。 あと、ファイルが大量にあるのでしたら、下記のフリーソフトで一括してテキストファイルへ変換できます。 「UNTAG」 http://www.vector.co.jp/soft/win95/net/se054122.html 的外れでしたらごめんなさい。

skmsk19410
質問者

お礼

有難うございます。 言われてみれば確かにその方法があると思います。

その他の回答 (1)

  • koko88okok
  • ベストアンサー率58% (3839/6543)
回答No.2

> この問題を解決するには、ワード上に読み込んだデータから罫線をきれいに消去すればよいと思うのですが、どうしたらよいでしょうか。 Word2000~2003の場合、 表全体を選択して、「罫線」→「変換」→「表の解除」→「文字列の区切り」を選択して「OK」で、罫線だけを削除できます。 Word2007の場合は、 表全体を選択して、「表ツール」の「レイアウト」タブ→「データ」グループの「表の解除」→」→「文字列の区切り」を選択して「OK」で、罫線だけを削除できます。 ちなみに、文字列を選択して表を作成することもできます。 お試し下さい。

skmsk19410
質問者

お礼

有難うございます。 表ごと読み込んだ後、表を解除するというのも方法ですね。

関連するQ&A

  • excel表をword上の罫線表にコピーできる?

    Excelでつくった表(10×10程度)をword文書上に「コピー」したいです。 ただし、コピー&ペーストではダメで、wordのちゃんとした罫線をつかった表でないといけません。 100セルの数値をすべて手で打ち込みなおすのは大変です。 うまくコピーして、しかもwordの罫線にするにはどうすればよろしいでしょうか?

  • excel2010で作成した文書をword変換

    excel2010で指定の罫線入りの表を作成。 そこに文字を記入しました。 この文書をwordに変換しようとしましたら、 デスクトップにBook1.htmというファイルが現われました。 このファイルを開くと、作成通りのものが出来ていました。 しかし、word形式で相手方に送信しなければなりません。 wordにコピーペーストしましたが崩れてどうしようもありません。 直すにも罫線などが動かずめちゃくちゃです。 このような難しいことは行ったことがありません。 どなたかやさしい方法をご教授願えませんでしょうか。よろしくお願い致します。

  • エクセルのもとからある罫線を復活させたい

    ある場所にある文字を、エクセルにコピーペーストすると、もとからあるエクセルの罫線?(薄い線)が消えてしまいます。貼り付けしたあとに、この線を出すことはできますか?

  • テキスト形式でコピーアンドペーストする方法

     ワードのファイルからワードのファイルへコピーアンドペーストする際には、フォントや文字の大きさなどの情報も一緒にコピーされてしまいます。テキストだけをコピーアンドペーストするために、いったんエディタを開きテキストファイルにする、という面倒な操作をしていましたが、テキストだけをコピーアンドペーストする簡単な方法はないでしょうか? 

  • ワードでテキストの貼り付けができません!

    さきほど焦って、Windows のカテゴリーにアップしてしまいました。同じ質問ですみません。仕事先から渡されたワードのファイルに上書き作業をしようとしたところ、コピーとペーストができません。文字の入力はできます。コピーしたいテキスト部分を反転させてコピーアイコンを押し、それを新しく開いたワード文書に貼り付けようとしても、ブランクになってしまいます。また、クリップボードにも表示されません。読み取り専用になっているのかと思い、ツール>オプション>セキュリティを見てみましたが、特に変わったチェックは入っていません。どうしたらいいでしょうか? ご回答よろしくお願いいたします。

  • 写真を取り込む方法

    ワードで文書を作成する際、写真を取り入れたいのですが、いざコピー&ペーストすると、文字がでてきてしまいます。印刷プレビューすればちゃんと写真は入っているのですが・・・文字ではなく、作成する画面でも写真を表示させるにはどうしたらよいのでしょうか。初心者なんで・・・ぜんぜんわかりません。お願いします。

  • Wordで、テキストボックスをコピペすると文字サイズが変わる

    Word2000で、ある文書内のテキストボックスを別文書にコピペすると、テキストボックス内の文字の大きさが変わってしまいます。 元の文書と全く同じ状態のまま、ペーストすることは可能でしょうか。 段落設定などが違う文書からコピーすると、変わってしまうのでしょうか… 今回コピーしたのは、たくさんのテキストボックスがグループ化されたものです。 Wordだと、PowerPointと違って、複数のテキストボックスを選んで一度にフォント設定を変更することができないみたいなので、とても不便です。 よろしくお願い致します。

  • ワードで作られた文書の削除方法

    通常はエクセルで作られている文書ばかりを作成してるのですが、仕様変更でワードで作られた文書を変更しないといけなくなりました。 しかし、ワードで作られた文書で罫線で作られたカッコが 「~~~」 |8 | ←ちょっと変ですが、8を囲ってる罫線だと思ってください ___」 のように、多く使われていて、消去じゃまったく消せません。 それで、1つずつ「罫線の削除」みたいなので消しているのですが、一度に消すことが出来ないので、すごく手間がかかってて仕事になりません。 そこで、上記のような罫線が多用されたワードの文書を一度に消してしまう方法を教えてください。 なお、オートシェイプは使われてなく、一度に消す際に「上にシフト」するなどを使用しないで消せる手っ取り早い方法をおしえてくださいませんでしょうか?

  • エクセルの罫線を固定させる方法って有りますか

    エクセルの罫線を固定させる方法って有りますか。 コピー、カット、ペーストを行うと、文字や数式だけでなく罫線もくっ付いてきますよね。カットならば罫線をはぎ取って持っていってしまいます。 やりたいのは、コピー、カット、ペーストを行っても罫線はいっさい変化なし、という状態にしたいんですが、出来ますでしょうか。 バージョンは、Mac版のOffice2004のExcel2004です。 よろしくお願いします。

  • テキストボックスの文字

    マイクロソフトのワード文書を作成しています。 図の一部に文字をいれたくて、テキストボックスに文字を入れました。 そのテキストボックスをコピーして、文字を変えましたら 先のテキストボックスもリンクしているかのように、同じように変わってしまいます。 消して、新しく作ってもまた、一つを直すと、他のものも同時に変わります。 何が原因で、どうすれば解決するでしょうか

専門家に質問してみよう