• 締切済み

pdfファイルのhtmlファイル化

企業のHPの中にサイズの大きなpdfファイル(1~5MB)が多数あり、「表示に時間がかかる」と評判が悪いので、ファイルを複数のhtmlファイルに分割し、目次を付けてリンクさせては、と思っています。 画像はAcrobatの「名前を付けて画像を抽出」で何とかなりそうですが、テキストは、 ・「テキスト選択ツール」でコピー/ペーストするのでは非常に手間がかかる。(画像/テキスト/表等が入り交じっているため) ・リッチテキストフォーマットで「名前を付けて保存」では、思いもかけないフォントコードになってしまいます。(明朝体が草書体になったり) 名案がありましたらご教示ください。

みんなの回答

  • bec
  • ベストアンサー率29% (151/507)
回答No.2

PDF化した元ファイルというのは存在するのでしょうか? それとも、Acrobatか、Illustrator等を使用して直接作成されているのでしょうか? 元ファイル(オリジナル)有れば、それをHTML化する方が簡単でしょう。 (Officeなんかは、HTML型式で保存が利きますしね  余分なタグが付くから、多少ファイルサイズは大きくなりますが) それと、PDF型式を採用した理由を確認した方が良いかもしれないですね。 ページの体裁にこだわっていたり、二次利用を禁止するために PDF型式を採用していたとなると、HTML化すると本末転倒ですからね。 この場合は、PDFにする時に画像の圧縮率を上げるなどして ファイルサイズを小さくしてみて下さい。 ただし、HTMLからのリンクでPDFファイルを表示させる場合には、 Acrbat(Reader)を起動させるため、どうしてもHTMLファイルよりかは 表示されるまでに時間がかかってしまいますが。

ubonoti01
質問者

お礼

有り難うございます。 担当を途中から引き継いだので詳細は判らないのですが、印刷屋に注文して、印刷物とpdfファイルを納入させたらしいのです。何かのDTPソフトを使っているとか・・・。 とくに「二次利用を禁止するために」ということはないようです。 ご指摘のように、連続してpdfを開く場合は少し早いようですね。

  • mld_sakura
  • ベストアンサー率20% (264/1282)
回答No.1

PDFをページごとに分割するフリーツールがあります。 http://www.forest.impress.co.jp/article/2003/01/28/pdfknife.html これでページをある程度の単位に分割してアップしてはどうでしょうか?

参考URL:
http://www.forest.impress.co.jp/article/2003/01/28/pdfknife.html
ubonoti01
質問者

お礼

有り難うございます。 ご教示のページを拝見しましたが、ダウンロードのページに行き着かなくて、テストができません。ダウンロードのページを教えていただけませんか?

関連するQ&A

  • pdfファイルから、テキストを抽出したい

    pdfファイルから、テキストを抽出したいと思っています。 テキスト選択ツールで、テキストを選択し、コピー&ペーストでも良いのですが、これだと一ページずつ細切れになってしまいます。 何とか、これを一度で、コピー&ペースト、ないし、抽出できる方法はないでしょうか?

  • PDFの文字フォントを変更したい

    お世話になります。 PDFのテキストデータが、「MS明朝」で埋め込みフォントで 作成されているのですが、これを「MSゴシック」変えたいと思っています。 可能でしょうか? ※所持しているソフトは、「acrobat pro」「just pdf」です。 可能でしたら、画像も含まれているPDFですので、画質等が下がらない 方法でお願いします。 何卒よろしくお願い致します。

  • PDFそのものから、テキストの抽出

    PDFそのものから、テキストの抽出は可能ですか? Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。 ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか? 逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

  • PDFファイルの作り方

    手元にあるテキスト、画像を元にPDF化したいと考えています。 作りたいファイルは単行本のように、文章、図表交じりで、縦書き。 場合によっては1ページ上下2段組。 このようなPDFを作りたい場合、Acrobatだけ買って、 テキストや図表を流し込んで編集作業は出来るのでしょうか? それとも他のワープロ等で編集してAcrobatに流し込むのでしょうか。

  • pdfファイルをWordで使いたいのですが・・・

    アクロバットのpdfファイルをWordで使いたいのですが、アクロバットから名前をつけて保存でリッチテキストに保存しようとすると、エンコードエラーみたいのが出て、保存したファイルにも内容が出ません。どうすれば、pdfをWordで使う事ができるのかどうか教えていただけませんか?よろしくお願いします。

  • pdfファイルがうまく表示されません

    インターネット上にあるpdfファイルを開くと、 下記のエラーが出てしまい、文字化けしてしまいます。 Acrobat Reader7で開こうとしています。 ちなみに「Acrobat Distiller 5」がインストールされている違うパソコンもあります。 <エラーメッセージ> 【埋め込みフォント「JDKGNB+MSMincho」を抽出できません。一部の文字を正しく表示できない場合や、印刷できない場合があります。】 どうやったら文字化けせずに開きますか? どなたが教えてください。 よろしくお願いします。

  • pdfファイルから抽出できるテキストと抽出できないテキスト

    Acrobat6.0Prof.を用い、テキスト選択モードでCTRL+Aすると、選択できるテキストと選択できない「テキスト」があります。選択できない「テキスト」をなぜ「テキスト」と判断したかといいますと、超拡大表示(例:6400倍)してもエッジがギザギザにならず鮮明に表示されるからで、これは明らかにアウトラインフォントと思われます。 このような「テキスト」を抽出する方法について知りたい。

  • PDF Acrobatのフォントを追加したい

    とある配布されたPDFファイルをAcrobat 9の編集で元の文章と同じフォントにしようしまして、その文章のプロパティでフォントがHGS明朝Bということを確認しできたのはいいのですが、新規にHGS明朝Bで文章を打ち込もうとすると使用可能なファントがシステムに存在しませんとなります。 どうすれば使えるようになりますでしょうか? よろしくお願い致します。

  • テキスト埋め込みなしのpdfファイル作成方法

    電子ブックを作ることになりました。 元になるのは文字ばかりのところに、少々画像が挿入されたファイルです。 先方の規定でpdf形式の画像ファイルで納品しなければいけません。 (つまりテキスト主体ではあるけれど、ページ全体を一つの画像として扱う。文字も画像の一部という位置づけ) 該当するファイルを出力してスキャンすれば済むのですが、手間がかかりすぎます。 (オートフィーダーつきのスキャナーは持ってません) word,Indesign,Quark,Acrobatなどをつかって、レイアウト済みのテキストファイルを「テキスト埋め込みなし(つまり画像ファイルとして)」でpdfファイル化する方法はありませんか? 当方Macがメインマシンですが、Windowsでも対応可能です。

  • pdfファイルについて

    よく文書を変換して使われていますね。 画像のようにとりこまれたり テキストが抽出できる場合もありますね。 ↑※この辺がよくわかりません。 どんな特色があるのでしょうか。 ファイルサイズが小さくなるとか ソフトを選ばないとか理解できるですが いまいち基本的な仕組みが理解できません。

専門家に質問してみよう