- 締切済み
PDF to Data
PDFをWordに変換したところ、 データが文字化けしていました。 なお、このPDFにはセキュリティがかかっており、 編集不可となっています。 しかし、私はこのPDFのパスワードを知っています。 きれいにWordに変換できないでしょうか?
- みんなの回答 (6)
- 専門家の回答
みんなの回答
- anonenone9
- ベストアンサー率0% (0/0)
PDFには次の2種類あります。 1.スキャナなどで読み取った写真のような画像をPDFにしたもの 2.Word、ExcelのようなアプリケーションからPDFにしたもの ------ 1.の場合、文字は画像になってしまっています。 2.の場合は、PDFの中のテキスト(文字)データは、画像ではなくコンピュータで扱える文字コードのデータが入っていることが多いです。 ------ 「いきなりPDF to Data(古いもの)」は、2も画像にしてOCRで文字認識します。ですので、文字認識を間違えたり、認識できなくて文字化けすることがあります。なお最新の「PDF to Data7」は、2は文字として解析するようです。 「リッチテキストPDF」は2のPDFについては文字や書式をPDFを解析して取り出しています。
- Wendy02
- ベストアンサー率57% (3570/6232)
#4 で書いた者です。 過去のOCRの検索をしていただければ分かりますが、その時に私が書いた内容とは、異なってきてしまいました。 今回、私が良いと思ったのは、「読んdeココ!」でした。使いこなしには少し難があるのかもしれませんが、押しなべて、OCRソフトは同様な感じです。認識率自体は、予想以上に高かったでした。 それで、#4 の内容を訂正しますが、私の送られてくる原稿(全部英語)は、Fax のコピーをpdf 化させたもので、すこぶる内容の品質は悪いですが、それでも、9割程度採れます。それで、pdf が印刷できるようになっているなら、まったく文字化けするというようなことはありえないのです。 'PDF to Data' の程度問題は別として、認識文字に対する設定の問題だと思うのです。例えば、日本語指定となっていれば、英字も含まれますので、認識できないことはありません。メーカー側のサポートが得られないとしたら、後は、設定をあれこれ換えて試してみるしかありません。 ただ、無理は言いませんが、なるべくなら、専用のOCRソフトを購入することをお勧めします。ソースネクストの製品が悪いとは申しませんが、なるべく、専用メーカーでサポートできる製品のほうがよいと思います。以前からの『読んdeココ!』ユーザーでしたが、トラブルがあって使っていませんでした。今回、さすがに、『読んdeココ!』のソフトメーカーは、エプソンと統合した結果なのか、格段に良くなっているのが分かります。
- Wendy02
- ベストアンサー率57% (3570/6232)
こんにちは。 今、仕事上で、私も同様の製品を購入しようとしています。最近、PDFが増えてきています。もちろん、私は、このような製品は、候補には入れませんが、気になったのでみてみました。 Amazon で、'PDF to Data' の同製品のメーカー側の説明を読んでみると、OCRエンジンは、パナソニックのものを使っているようです。パナソニックは、『読取革命』という製品で、現在、Canon の付属のOCRとして採用されています。今、この製品は定評はあります。 OCR自体は、Amazon のユーザーの書評は、ほとんど、いままで、OCRを使用したことがなかった人ではないかとは思います。OCR自体は、その使いこなしを覚えるまで、ある程度の期間を必要とします。ただ、簡易ソフトですと、例えば、英文・和文などの言語の種類、漢字・英字・ひらがな などの文字の種類の分別機能がなかったり、段落などを判別できなかったり、自動修正用の辞書が入っていなかったりします。 また、肝心なことですが、PDFを作成する場合に、画像の精度の問題があって、カラー画像で、デフォルト設定のままですと、だいたい、100 dbi になってしまいます。相手の方が、白黒画像で、300 dpiぐらいにしていてくれれば、まったく問題は起こらないのですが、100 dpi では、ほとんど、採れる見込みはありません。ただし、レイアウトだけでも取れれば、それはそれで利用出来ます。 元が、どの程度の画像で変換したかであって、あながち、そのソフトの問題とはいえないと思います。パスワードを外してみて、コピー&ペーストでテキストが出てこないでしょうか? ただ、仮に、100 dpi で、文字化けだらけでも、本格的なOCRソフトのほうが編集は楽です。 なお、#1さんのご回答が一番確かであるのは言うまでもありません。
どうやって「PDFをWordに変換した」のですか? 何か変換ツールが存在して、それを使ったとか? ファイル名の拡張子「.pdf」を「.doc」に変更しただけとか?
- takepon256
- ベストアンサー率41% (391/936)
このソフトはPDFを画像として扱って、OCR(文字認識)で文章に直しているので、文字化けは必ずといっていいほど発生します。 アマゾンのレビューを見ても「使い物にならない」的な感想が多いです。 http://www.amazon.co.jp/%E3%82%BD%E3%83%BC%E3%82%B9%E3%83%8D%E3%82%AF%E3%82%B9%E3%83%88-%E3%81%84%E3%81%8D%E3%81%AA%E3%82%8APDF-to-Data-%E8%AA%AC%E6%98%8E%E6%89%89%E4%BB%98%E3%81%8D%E3%82%B9%E3%83%AA%E3%83%A0%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8%E7%89%88/dp/B00080DZ7M
- n-jun
- ベストアンサー率33% (959/2873)
>私はこのPDFのパスワードを知っています。 知っている間柄なら、元ファイルを貰った方がいいのでは? (元ファイルがWordであるなら)
補足
ソースネクストの「PDF to Data Professional 2」を使用してです。