Word文書を扱いやすいHTMLに変換する方法はないものか?

このQ&Aのポイント
  • Word文書をHTMLに変換する際、Word自体のHTML保存機能ではレイアウトのカスタマイズが難しく、ゴミタグも多くなります。
  • 扱いやすいHTMLとは、スタイルをCSSファイルに書き出し、DIVの乱用を避け、Pタグのクラス指定を基本とすることです。
  • 特定の見出し区切りでHTMLを分割する場合、見出し段落名をクラス指定で書き出し、CSSファイルにすべてのスタイルをまとめることが重要です。
回答を見る
  • ベストアンサー

Word文書のHTML変換

Word文書を扱いやすいHTMLに変換する方法はないものかと、現在色々と調査しています。 Word自身にもHTML保存機能はありますが、レイアウト等をWeb用にカスタマイズするには中身が複雑すぎますし、ゴミタグも多いので、あまり現実的ではありません。 扱いやすいHTMLの定義としましては、 ・スタイルはすべてCSSファイルに書き出し。 ・DIVは乱用しない。基本はPタグのクラス指定。 ・特定の見出し(または段落スタイル)でHTMLを分割できる。 だと思うのですが、良いツールや手法などないものなのでしょうか? 特定の見出し区切りでHTMLを分割する機能については、見出し段落名をClass指定で書き出せれば、あとからVBScriptなどで分割処理可能なので、重要なのはスタイルをすべてCSSファイルに書き出してくれるということだと思っています。 宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
noname#39970
noname#39970
回答No.1

とても個人的な考えだけど WORD → rtf →(何か別のツールで)→ HTML という変換はどうだろう。 wordの良くわからないHTML吐きが信用できないみたいだから rtf経由でそれなりに綺麗なHTMLを吐けそうな物を探したら まぁWORDに吐かせるよりはマシかもしれない。 http://www.google.co.jp/search?q=rtf%E3%82%92%20html%E3%81%AB%20%E5%A4%89%E6%8F%9B&hl=ja&lr=lang_ja イマイチ出てこない・・・

qualheart
質問者

お礼

回答有り難うございます。 RTFも考えたのですが、2バイトテキストがASCIIコードに変換されてしまうという難点があるんですよね。ASCIIコードを通常のShift-JISコードの文字に変換できるツールで元に戻してしまえばできるのかも知れませんけど。 それにほんの3行ほどの文章でもRTF保存してテキストエディタで開くと、とんでもない量の情報が入ってるんですよね。フォーマット仕様を理解して、タグ付け変換するのもかなり難儀そうな感じです。 RTFをHTML変換できるようなソフトがないかどうか、もう一度自分で調べてみます。 有り難うございました。

関連するQ&A

  • word2002でグループ文書の段落番号が消失しました。

    word2003上で作成していたグループ文書をword2002で読み込んだところ、段落番号が全て消えてしまいました。 サブ文書をそれぞれ、別個に開くと問題なく見えるのですが、グループ文書にして開くと見出しに設定していた段落番号が全て消えて表示されます。 見出しの構成までは消えていないです。これは全ての見出しに段落番号を再設定しないとダメなんでしょうか。 よろしくお願いします。

  • ワード→HTML変換

    ワード→HTML変換をしたいのですが、ファイルがたくさんあって 一つ一つ開いて変換をしてると時間がかかってしまいます。 例えば、フリーソフトやフォトショップのバッチ処理みたいな 機能などいい方法があれば教えてください。 よろしくお願いします。

  • 複数のワード文書の結合方法

    分割して作成したワード文書を結合する方法をどなたかお分かりになる方教えて下さい。 分割して作成した見出しを含む複数の文書を、最後に目次つきでひとつのファイルにまとめたいと思っています。 1.グループ文書ですと、ファイルは複数のままだと思いますし。 2.コピペでは、なぜかスタイルか何かが変わって体裁が変化することが私の経験では過去にありましたし。。

  • ワードで見出し2のつけ方

    宜しくお願いします。 ワードのスタイルと書式で、 1. ~~  1) ~~ としていたのですが 2.~~~  15)~~ (見出し2が、見出し1の続きで番号が振られてしまう) これを直す方法はないでしょうか_? 1.~~ 1) にょろにょろ 2.~~ 1)~~ というような感じで、レベル1が次の段落に行ったときに レベルにもまた1から振りなおせるようにしたいです。 教えてください、宜しくお願いします。

  • FireworksでのHTML書き出しについて

    HTML、CSSを勉強中の初心者です。 初歩的な質問ですが、お答えいただけると幸いです。 Webページ制作について自分なりに色々調べていたところ、一般的にWebページを作る場合、FireworksでHPをレイアウトし、スライス→書き出しをした後に、書き出した画像を一つ一つ(手打ち、もしくはDreamweaverなどで)配置する、というのが主流のようです。 しかし、実際にFireworks CS6を使ってみたところ、書き出し時に「HTMLと画像の書き出し」、「CSSと画像の書き出し」というものがありました。 「HTMLと画像の書き出し」では、テーブルが使用されているため、現在は推奨されないと思いますので、使用されないのはわかるのですが、「CSSと画像の書き出し」では、現在主流となっているCSSでのレイアウトになっているようでした。 書き出されたHTMLを確認してみたところ、表示・ソースも一見問題ないように見えたのですが、この機能があまり使われていないのはなぜでしょうか。 ※もちろん、この書き出しはただ一枚のページを作っただけで、そこから様々な動作をつけるのは自分でやらなければいけないのは理解しています。

  • ワード文書の見出し2のスタイルを変更したい。

    ワード文書の見出し2のスタイルを変更したい。 50ページ以上あるワード文書の見出し2の文字列をすべて太字に訂正したいのですが、一挙にやる方法をご存じでしたら、お教えください。 ワード2000を使用しています。

  • wordで段落書式をアウトラインにしたいが。。

    word2000をインストールしたままのデフォルト状態で使用中です。 見出し1、見出し2の頭に段落番号を入れて 1 見出し1 1-1 見出し2 1-2 見出し2 2 見出し1 2-1 見出し2 としたいんですが、これをやろうとして見出し2を選択した状態で、「スタイル」ー「変更」ー「書式」ー「箇条書きと段落番号」を選んで「アウトライン」を選択しただけだと、 1 見出し1 1-1 見出し2 1-2 見出し2 2 見出し1 1-3 見出し2 というふうに、最後の見出し2の段落の段落番号が1-3になってしまいます。ここを2-1にしたいのです。 やり方をご存知の方は教えてください。(latexなら簡単なのに!!!)

  • wordの段落スタイルについての素朴な質問

    基本的な事なのですが、どうにも良く分からないので教えてください。 wordを起動した時に既定のスタイルは[標準] [見出し1] [見出し2] [見出し3] [段落フォント]の5種類だけでよね。 この中の[段落フォント]の意味がわかりません。何の為に使うのでしょうか? どうか教えてください!よろしくお願いします。

  • 外部CSSが反映されるHTMLとされないHTML

    レンタルサーバのファイルマネージャを使ってサイトを作っています。 外部CSSで文字のフォントをMS Pゴシックに統一したいのですが、反映されるページとされないページができました。 CSSには、 @charset "Shift_JIS"; p { font-family: "MS Pゴシック",sans-serif; } 読み込みには、 <link href="./style.css" rel="stylesheet" type="text/css"> と記述しました。 反映されたのはサイト2ページ目の2分割フレームの片側だけで、その他のページはブラウザで指定したフォントのままCSSが反映しません。 HTML、CSS共に文字コードはShift_JISで統一していて、それぞれ<head></head>間の同じ位置に記述してあります。 反映されたHTML内にはボックスの幅指定でCSSを使っていますが、その他のページにはCSSを使っていません。違いはこれだと思うのですが、それがきっかけで反映されたりされなかったりと変わるものなのでしょうか? HTML、CSS共に初心者です。この質問が初歩的なことなのか難しいことなのかもわかりません。 よろしくお願いします。

  • Wordの段落番号の振り方

    Word2003で 1. 1.2 1.2.3 1.2.3.1 1.2.3.2 1.2.4 1.2.4.1 1.2.4.2 のように段落番号を振りたいのですが、 スタイルの「見出し4」を使うと 1 1.2 1.2.3 1.1.1.1 1.1.1.2 1.2.4 1.1.1.3 1.1.1.4 のようになってしまいます。 (見出し3までは自動的に番号が振られます。) アウトライン番号の書式設定で 番号書式を1.2.4.1にして開始番号を1に すればできないこともないのですが、 見出し3(1.2.3のレベルのもの)が たくさんありすぎて、それはやりたくありません。 どのようにやればよいのか、教えて下さい。

専門家に質問してみよう