• ベストアンサー

PDF(文章と画像)からテキストの変換

もともとはWordでつくられたPDFファイルAdobe Acrobat 7.0 Document、文章とスキャナでとった画像多数が混在したもの)を 元のテキスト形式に変換したいのですが、そのような方法ありますか?

質問者が選んだベストアンサー

  • ベストアンサー
  • me-guru
  • ベストアンサー率57% (308/535)
回答No.2

http://oshiete1.goo.ne.jp/qa4035049.html このあたりにありますね。 ただ、元のPDFのセキュリティー・レベルによっては使えない時があります。

その他の回答 (1)

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1

コンバータですね。無料のはないです。 http://www.antenna.co.jp/RPD/

関連するQ&A

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。

  • PDFにうまく変換できません

    アドビアクロバットについて教えてください。 Office Word のファイルをアクロバット6.0でPDFに変換したところ,貼り付けてある画像の部分にだけ罫線がかかってしまいます。 大変初歩的な問題だと思いますが,よろしくお願いします。

  • Acrobat 6.0でPDF出力すると画像の乱れ

    ワード2000で作成したドキュメントをAdobe Acrobat6.0を使用してPDF化しています。 ドキュメントは100ページ以上もあり、JPG画像をぺたぺた貼っていますがなぜか何度PDF出力しても同じページの画像がぐにゃ~っと乱れます。 元のワードファイルでは普通なのですが。。 原因をご存知の方教えてください。 宜しくお願いします。

  • PDFのアクセシブルテキストへの変換について

    Adobe Reader 9の「テキストとして保存」機能を使って、PDFファイルをテキスト(アクセシブル)に変換したいのですが、変換が失敗(0バイトのテキストを出力)してしまい、上手く変換できません。 他のPDFファイルでテキスト変換を行ってみたところ、変換できるファイルと失敗するファイルがあることが、わかりました。 また、テキストではなく、リッチテキストやWordへ変換してみましたが同様の動作が発生しました。 そのほか、Acrobatを使用されている方に変換できないファイルを送付し、変換をお願いしたところ、プレーンテキストでの変換は成功したが、アクセシブルテキストへの変換は失敗(0バイトのテキストを出力)とのことでした。 PDFのプロパティで比較してみたところ、ともに「セキュリティなし」になっていたので、テキスト本文は変換可能な状態のように思えますが、他に原因となる理由が見つかりません。 アクセシブルテキストへの変換目的は、本文以外に文章内の制御コード(改行、改ページ)の情報を持ち出すことです。 何か回避策や、上記要件を満たせるフリーソフトの情報などがあれば、ご教示願います。 よろしくお願いいたします。

  • PDFをワードに変換

    Microsoft ワードの「ファイル」の「開く」でPDFのファイルを指定すると、そのPDFの内容がワードファイルとして読み込まれます。  PDFに図面が混じっている場合や余白部分にページ番号等が記載されている場合に意味不明なワード文章となることは仕方ないと思います。  しかしPDFが文章だけの場合でも、読み取ったワード文章にワードのフォントと画像(文字表す画像)とが混在する場合があります。  もう少し優れたPDF→ワード変換ソフトは開発されていないのでしょうか。元のPDFデータを一度濃く印字してOCRで読み直してから、変換した方が正確に変換される場合もあるでしょうか。

  • EPSがPDFに綺麗に変換されない

    Illustratorで作成したEPS画像をWordに埋め込んだ論文をAdobe AcrobatでPDFに変換したいのですが、綺麗に出力されません。EPS画像中のフォントが微妙にごてごてしている上に、曲線も滑らかでありません。 EPS画像を綺麗に出力するには、どのように変換すれば良いのでしょうか? 同じWordファイルを用いて、出版社に変換してもらったPDFは綺麗に出力されていたので、変換の方法を何回か尋ねたのですが、質問の意図が伝わらなかったのか、適切な答えをもらえなかったので、ここで質問させていただきました。 また、print2pdfというソフト(http://sourceforge.net/projects/print2pdf/)でも、出版社で変換してもらったものと同様に綺麗に出力できたのですが、無料のソフトにできて、Adobe Acrobatにできないはずもないと思うので、やり方を教えていただきたいです。 Adobe Acrobatのバージョンは、Acrobat 9 Pro Extendedです。

  • PDFに変換した文章の編集

    Adobe Acrobat X Pro の無償体験版を使用しています。 PDFに変換した文章の編集をするにはどうすればよいのか教えてください。 「ツール」→「コンテンツ」→「テキストとオブジェの編集」までは行きますが、「文章テキストを編集」をクリックしてもPDF画面が反応しません。

  • adobe acrobat6.0を使ってのPDFに変換について

    adobe acrobat6.0を使ってテキストファイル、HTMLファイルをPDFに変換すると出来上がったPDFの文面に変換元のファイルのパスが表示されます。 変換の時このファイルパスを表示させないためにはどうすればいいのでしょうか?

  • PDFからの変換

    ワード等で作成した文書などをスキャナでPDF化するという物凄く単純なことは自分でも出来ますが、一度PDF化したものを元に戻すというのは難しいのでしょうか?最低限テキストデータだけでも元のデータに復元することは可能なのでしょうか?それともPDFとはあくまで画像データの一種でありテキスト等への変換は不可能でしょうか。そもそも画像データはテキストに出来ないのでしょうか。ソフトがあれば可能と聞いた気もするのですが。

  • ワードの文章を印刷できない(自動にPDFに変換)

    なぜかワードで作成した文章、またはネットの記事を印刷したくっても 以前はスムーズに印刷できたが、いまでは印刷を指定すると、ファイルの種類の見出しがPDFドキュメント(Adobe Acrobat)になっており、保存しか指定できないため印刷ができないのでかなり困っています。 パソコンの新しい機能をアップグレードしているうちに、いつのまにかこういう状態に変換されたのかもしれない... ご教示いただけましたら大変助かります。 よろしくお願いいたします。

専門家に質問してみよう