• 締切済み

Wordのタグを簡単に取り除く方法

MS Wordで作成されたページは、フォントの情報など要らないものが一杯残っているのですが、これを削除して、スッキリしたHTMLにする方法はないでしょうか? Wordで作られたページが500個くらいあるので、これをまとめて一気にきれいにする方法があればうれしいです。 Wordで作成されたページは ・簡単な表が使われています。 ・文字の大きさが設定されています。 これを、 ・表の情報と文字の大きさの情報だけ残す (フォントの種類などの情報は消す) ようにしたいです。

  • HTML
  • 回答数2
  • ありがとう数1

みんなの回答

  • RAPTsong
  • ベストアンサー率42% (74/175)
回答No.2

秀丸などのテキストエディタで開いて、置換機能を使用して無に 一斉置換をかけることである程度対応できます。 Wordで作ったということで、ある程度パターン化が望まれるため、 正規表現を使用すると多少楽かもしれません。 あとはRubyなどのスクリプト言語を利用する方法もあります。 無に変換するスクリプトを書いて、500個のファイルをまとめて 一気に大雑把に置換するという手段がありそうです。 あとは…、見栄えを無視して文書情報だけ抜き取って、 (WORDかブラウザで開いてテキストファイルとして保存する) 手動で文書構造を構成し、後からCSSなどを利用して見栄えを 処理するとか。

  • mario33
  • ベストアンサー率19% (7/36)
回答No.1

無いと思ったほうがいいのかもしれません。不要なタグを削除するソフトはフリーであるかもしれませんが、Dreamweaverで一回やってみたことがあるのです。 ですが、上手にいかないのです。レイアウトはくずれるは、なんやらかんやらでとにかくうまくいきません。 レイアウトを維持しつつタグを削除するのは至難の技なのかもしれません。

関連するQ&A

  • ホームページの文字をMS Wordでフォントサイズ12にする方法?

    ホームページ上の文字をコピペでMS Wordに貼り付けたときに、それらの文字のWordでのフォントサイズが12になるようにHTML(HTML以外を使用しても結構です。)を組みたいのですがどうすれば良いでしょう?  Wordの方には、できるだけ特殊な設定をしたくありません。 ホームページ上の文字をコピペでMS Wordに貼り付けたときには、通常、フォントサイズは10.5になります。 IE6&7 Word2000以降 よろしくお願いします。

  • wordでのフォントについて

    word2002で、文(表を含む)を作成する場合、初期設定で、MS-明朝になります。 その場合(デスクトップ)、キーボード上、上部の数字は、MS-明朝のようです。 でも、テンキー(右側の部分)は、「sentury」という、フォントになります。これが、デフォルトなんでしょうか? あと、この場合、どちらも、任意のフォントで固定する事は、出来ないでしょうか? 自分の場合ですが、何も設定をいじっていないのに、MS-明朝になったり、MS-ゴシックになったりするような気がします。 そんな時は、一番最後に、すべて選択し、一気に変換しているのですが、状況により、文字が多少ずれることがあるので、手直しが発生します。 これが面倒なのです。

  • (エクセル→ワード)下線などの情報は引き継がれないのでしょうか?

    既出かもしれませんが、うまく探せなかったので、質問させてください。 エクセルで作成した表をワードで作り直すことになりました。 (「形式を選択して貼り付け」すると変なところで切れたりするので…) 文字は大部分をMS明朝で作成しているのですが、 ところどころMSゴシックにしていたり、下線をつけているところがあります。 ところが、セル内の文字をコピーしてワードに持ってきても その情報が全部クリアになって、MS明朝だけでペーストされてしまいます。 このフォントの変更や下線をそのままワードに持ってくることはできないでしょうか?

  • Word2007

    Word2007 Wordで、ある文書で表を印刷しようとしたところ、2ページ目には何も入力していないのですが、 2ページ目が印刷されてしまいます。 これはどのように削除したらいいでしょうか。 ※1ページ目にすべて表のみで作成されており2ページ目の最初に改行が一つあります。 [ ページ設定 ]で行数と文字数を最大にしても2ページ目が印刷されてしまいます。 どなたかご教授下さい。

  • HTMLファイルをWordで開くと文字化けします。

    MacBookAirにoffice 365 for Macを使用しております。 HTMLファイルをWordで編集したいのですが開くと全体的に文字化けを起こしております。 HTMLファイルはWindowsのWordで作成後、HTMLファイルに保存したものになり、フォントはMS Pゴシックです。 MACにもMS Pゴシックフォントは入れているのですがWordのフォント欄を見ると「lr oSVbN」と表示されておりまして、MS Pゴシックに指定しても文字化けは直りません。 文字化けが改善でき何かいい解決策はございますでしょうか? アドバイスいただければと思いますので何卒よろしくお願い致します。

  • ワードでのフォント

     こんにちは。ワードで新規の文書を作る場合に、 通常のスタイルを決めておくのですが、たまにはそれじゃないフォントで文書を打ち込んでみたいと思い、 試みてみたところ、出来るものと出来ないものが出てきてしまいました。例えばですが、ページ設定というところを開いて、フォントの設定をする場合には、その中には無いフォントがあり、新規作成でひらいた文書1の画面で上のバーのフォントをクリックすると、それ以上の沢山のフォントが出てきます。で、その中のフォントを使いたいのですが、文字が変換できません。仮に一度MSゴシックというので打ち込んだ後に、ドラッグしてから、JISゴシックをクリックすると、文字が変換されますよね?ところが、ページ設定にはでてこないけれども、文書1として一度開いたところの上のフォントのバーには、OCRーBというタイプのフォントがあるので、それを使いたいのですが、変換されません。  この場合どうしたら、いいのでしょうか? ダウンロードしてきた全てのフォントをスムーズに使う方法がありましたら、設定の仕方を教えてください。宜しくお願いします。

  • Word2002表のスタイルについて

    Word97で作成したドキュメントをWord2002で開いたところ、表のスタイルが変更されてしまいました。具体的には、 Word97で「日本語:MS明朝、英語:Times New Roman」に設定したスタイル(スタイル名「Table」)の表内の文字が、Word2002では「日本語:MS明朝、英語:Century」に変換されます。 1.Word97で設定したスタイルをそのまま活かすにはどうすればよいでしょうか? 2.Word2002には表のスタイルに「標準の表」という名前のスタイルがあるのを見つけました。この設定フォントを見たところ、英語が「Century」になっています。これが要因のひとつでしょうか? 3.「標準の表」は、フォントの変更ができません。どうしてでしょうか? 補足:Word2002において、スタイル名「標準」の英語は「Times New Roman」にしています。

  • Wordで桁をそろえる方法

    Wordで書体をMSゴシックで書いているとき Fontは色々なサイズを使います。 Fontの種類も全角漢字、かたかな 半角英数字と色々な種類を使います。 このようにしたとき行間で数字の桁位置を そろえるとか文字の位置をそろえようとすると ズレが発生します。 (修正できません) このようなズレをなくすために Fontの種類 Fontのサイズ 文字(全角等・・・)の種類 についてどのような配慮をしてかくべきか 教えてください。

  • Word2000 一気に単語登録&削除の方法

    Word2000を使用しています。 文字入力はMS-IMEを使用しています。 Wordでたくさんの言葉を単語登録したのですが それを別のパソコン(Word2000)に一気に登録する方法は あるでしょうか? また、それを一気に削除する方法はあるでしょうか? 拙いご説明で申し訳ございませんが、よろしくお願い致します。

  • ワードの書式設定

    ワードの書式設定、特にフォントのことなんですが、通常はMS明朝になっているのですが、これをほかのフォントに変えたいんです。 『ファイル』-『ページ設定』-『フォントの設定』で希望のフォントを設定し、これをデフォルトにしたいのですが、この画面で左下にある『既定値として設定』が選択可能にならないのです。 仕方なくokを押して前の画面に戻るのですが、ここで『既定値として設定』のボタンを押すとこの文書のフォントは変わるのですが、新しい文書を作ろうとして新規作成を押してもフォントはMS明朝に戻ってしまうのです。 これを希望のフォント、具体的には『AR丸ゴシック体M』にしたいのですが、どうすればいいのでしょう? なお、ワードは2003を使っています。

専門家に質問してみよう