• 締切済み

PDF to Data

PDFをWordに変換したところ、 データが文字化けしていました。 なお、このPDFにはセキュリティがかかっており、 編集不可となっています。 しかし、私はこのPDFのパスワードを知っています。 きれいにWordに変換できないでしょうか?  

みんなの回答

回答No.6

PDFには次の2種類あります。 1.スキャナなどで読み取った写真のような画像をPDFにしたもの 2.Word、ExcelのようなアプリケーションからPDFにしたもの ------ 1.の場合、文字は画像になってしまっています。 2.の場合は、PDFの中のテキスト(文字)データは、画像ではなくコンピュータで扱える文字コードのデータが入っていることが多いです。 ------ 「いきなりPDF to Data(古いもの)」は、2も画像にしてOCRで文字認識します。ですので、文字認識を間違えたり、認識できなくて文字化けすることがあります。なお最新の「PDF to Data7」は、2は文字として解析するようです。 「リッチテキストPDF」は2のPDFについては文字や書式をPDFを解析して取り出しています。

参考URL:
http://www.antenna.co.jp/rpd/
  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.5

#4 で書いた者です。 過去のOCRの検索をしていただければ分かりますが、その時に私が書いた内容とは、異なってきてしまいました。 今回、私が良いと思ったのは、「読んdeココ!」でした。使いこなしには少し難があるのかもしれませんが、押しなべて、OCRソフトは同様な感じです。認識率自体は、予想以上に高かったでした。 それで、#4 の内容を訂正しますが、私の送られてくる原稿(全部英語)は、Fax のコピーをpdf 化させたもので、すこぶる内容の品質は悪いですが、それでも、9割程度採れます。それで、pdf が印刷できるようになっているなら、まったく文字化けするというようなことはありえないのです。 'PDF to Data' の程度問題は別として、認識文字に対する設定の問題だと思うのです。例えば、日本語指定となっていれば、英字も含まれますので、認識できないことはありません。メーカー側のサポートが得られないとしたら、後は、設定をあれこれ換えて試してみるしかありません。 ただ、無理は言いませんが、なるべくなら、専用のOCRソフトを購入することをお勧めします。ソースネクストの製品が悪いとは申しませんが、なるべく、専用メーカーでサポートできる製品のほうがよいと思います。以前からの『読んdeココ!』ユーザーでしたが、トラブルがあって使っていませんでした。今回、さすがに、『読んdeココ!』のソフトメーカーは、エプソンと統合した結果なのか、格段に良くなっているのが分かります。

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.4

こんにちは。 今、仕事上で、私も同様の製品を購入しようとしています。最近、PDFが増えてきています。もちろん、私は、このような製品は、候補には入れませんが、気になったのでみてみました。 Amazon で、'PDF to Data' の同製品のメーカー側の説明を読んでみると、OCRエンジンは、パナソニックのものを使っているようです。パナソニックは、『読取革命』という製品で、現在、Canon の付属のOCRとして採用されています。今、この製品は定評はあります。 OCR自体は、Amazon のユーザーの書評は、ほとんど、いままで、OCRを使用したことがなかった人ではないかとは思います。OCR自体は、その使いこなしを覚えるまで、ある程度の期間を必要とします。ただ、簡易ソフトですと、例えば、英文・和文などの言語の種類、漢字・英字・ひらがな などの文字の種類の分別機能がなかったり、段落などを判別できなかったり、自動修正用の辞書が入っていなかったりします。 また、肝心なことですが、PDFを作成する場合に、画像の精度の問題があって、カラー画像で、デフォルト設定のままですと、だいたい、100 dbi になってしまいます。相手の方が、白黒画像で、300 dpiぐらいにしていてくれれば、まったく問題は起こらないのですが、100 dpi では、ほとんど、採れる見込みはありません。ただし、レイアウトだけでも取れれば、それはそれで利用出来ます。 元が、どの程度の画像で変換したかであって、あながち、そのソフトの問題とはいえないと思います。パスワードを外してみて、コピー&ペーストでテキストが出てこないでしょうか? ただ、仮に、100 dpi で、文字化けだらけでも、本格的なOCRソフトのほうが編集は楽です。 なお、#1さんのご回答が一番確かであるのは言うまでもありません。

noname#204879
noname#204879
回答No.3

どうやって「PDFをWordに変換した」のですか? 何か変換ツールが存在して、それを使ったとか? ファイル名の拡張子「.pdf」を「.doc」に変更しただけとか?

tarou0831
質問者

補足

ソースネクストの「PDF to Data Professional 2」を使用してです。

回答No.2

このソフトはPDFを画像として扱って、OCR(文字認識)で文章に直しているので、文字化けは必ずといっていいほど発生します。 アマゾンのレビューを見ても「使い物にならない」的な感想が多いです。 http://www.amazon.co.jp/%E3%82%BD%E3%83%BC%E3%82%B9%E3%83%8D%E3%82%AF%E3%82%B9%E3%83%88-%E3%81%84%E3%81%8D%E3%81%AA%E3%82%8APDF-to-Data-%E8%AA%AC%E6%98%8E%E6%89%89%E4%BB%98%E3%81%8D%E3%82%B9%E3%83%AA%E3%83%A0%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8%E7%89%88/dp/B00080DZ7M

  • n-jun
  • ベストアンサー率33% (959/2873)
回答No.1

>私はこのPDFのパスワードを知っています。 知っている間柄なら、元ファイルを貰った方がいいのでは? (元ファイルがWordであるなら)

関連するQ&A

専門家に質問してみよう