• 締切済み

PDF to Data

PDFをWordに変換したところ、 データが文字化けしていました。 なお、このPDFにはセキュリティがかかっており、 編集不可となっています。 しかし、私はこのPDFのパスワードを知っています。 きれいにWordに変換できないでしょうか?  

みんなの回答

回答No.6

PDFには次の2種類あります。 1.スキャナなどで読み取った写真のような画像をPDFにしたもの 2.Word、ExcelのようなアプリケーションからPDFにしたもの ------ 1.の場合、文字は画像になってしまっています。 2.の場合は、PDFの中のテキスト(文字)データは、画像ではなくコンピュータで扱える文字コードのデータが入っていることが多いです。 ------ 「いきなりPDF to Data(古いもの)」は、2も画像にしてOCRで文字認識します。ですので、文字認識を間違えたり、認識できなくて文字化けすることがあります。なお最新の「PDF to Data7」は、2は文字として解析するようです。 「リッチテキストPDF」は2のPDFについては文字や書式をPDFを解析して取り出しています。

参考URL:
http://www.antenna.co.jp/rpd/
  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.5

#4 で書いた者です。 過去のOCRの検索をしていただければ分かりますが、その時に私が書いた内容とは、異なってきてしまいました。 今回、私が良いと思ったのは、「読んdeココ!」でした。使いこなしには少し難があるのかもしれませんが、押しなべて、OCRソフトは同様な感じです。認識率自体は、予想以上に高かったでした。 それで、#4 の内容を訂正しますが、私の送られてくる原稿(全部英語)は、Fax のコピーをpdf 化させたもので、すこぶる内容の品質は悪いですが、それでも、9割程度採れます。それで、pdf が印刷できるようになっているなら、まったく文字化けするというようなことはありえないのです。 'PDF to Data' の程度問題は別として、認識文字に対する設定の問題だと思うのです。例えば、日本語指定となっていれば、英字も含まれますので、認識できないことはありません。メーカー側のサポートが得られないとしたら、後は、設定をあれこれ換えて試してみるしかありません。 ただ、無理は言いませんが、なるべくなら、専用のOCRソフトを購入することをお勧めします。ソースネクストの製品が悪いとは申しませんが、なるべく、専用メーカーでサポートできる製品のほうがよいと思います。以前からの『読んdeココ!』ユーザーでしたが、トラブルがあって使っていませんでした。今回、さすがに、『読んdeココ!』のソフトメーカーは、エプソンと統合した結果なのか、格段に良くなっているのが分かります。

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.4

こんにちは。 今、仕事上で、私も同様の製品を購入しようとしています。最近、PDFが増えてきています。もちろん、私は、このような製品は、候補には入れませんが、気になったのでみてみました。 Amazon で、'PDF to Data' の同製品のメーカー側の説明を読んでみると、OCRエンジンは、パナソニックのものを使っているようです。パナソニックは、『読取革命』という製品で、現在、Canon の付属のOCRとして採用されています。今、この製品は定評はあります。 OCR自体は、Amazon のユーザーの書評は、ほとんど、いままで、OCRを使用したことがなかった人ではないかとは思います。OCR自体は、その使いこなしを覚えるまで、ある程度の期間を必要とします。ただ、簡易ソフトですと、例えば、英文・和文などの言語の種類、漢字・英字・ひらがな などの文字の種類の分別機能がなかったり、段落などを判別できなかったり、自動修正用の辞書が入っていなかったりします。 また、肝心なことですが、PDFを作成する場合に、画像の精度の問題があって、カラー画像で、デフォルト設定のままですと、だいたい、100 dbi になってしまいます。相手の方が、白黒画像で、300 dpiぐらいにしていてくれれば、まったく問題は起こらないのですが、100 dpi では、ほとんど、採れる見込みはありません。ただし、レイアウトだけでも取れれば、それはそれで利用出来ます。 元が、どの程度の画像で変換したかであって、あながち、そのソフトの問題とはいえないと思います。パスワードを外してみて、コピー&ペーストでテキストが出てこないでしょうか? ただ、仮に、100 dpi で、文字化けだらけでも、本格的なOCRソフトのほうが編集は楽です。 なお、#1さんのご回答が一番確かであるのは言うまでもありません。

noname#204879
noname#204879
回答No.3

どうやって「PDFをWordに変換した」のですか? 何か変換ツールが存在して、それを使ったとか? ファイル名の拡張子「.pdf」を「.doc」に変更しただけとか?

tarou0831
質問者

補足

ソースネクストの「PDF to Data Professional 2」を使用してです。

回答No.2

このソフトはPDFを画像として扱って、OCR(文字認識)で文章に直しているので、文字化けは必ずといっていいほど発生します。 アマゾンのレビューを見ても「使い物にならない」的な感想が多いです。 http://www.amazon.co.jp/%E3%82%BD%E3%83%BC%E3%82%B9%E3%83%8D%E3%82%AF%E3%82%B9%E3%83%88-%E3%81%84%E3%81%8D%E3%81%AA%E3%82%8APDF-to-Data-%E8%AA%AC%E6%98%8E%E6%89%89%E4%BB%98%E3%81%8D%E3%82%B9%E3%83%AA%E3%83%A0%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8%E7%89%88/dp/B00080DZ7M

  • n-jun
  • ベストアンサー率33% (959/2873)
回答No.1

>私はこのPDFのパスワードを知っています。 知っている間柄なら、元ファイルを貰った方がいいのでは? (元ファイルがWordであるなら)

関連するQ&A

  • いきなりPDF to DATA

    「いきなりPDF to DATA 」をダウンロードして、PDFからワードに変換しましたが、日本語は、80%くらいは判読可能、英語は、文字化けして全く判読できません。英語がもう少し利用可能な程度に変換できるとすごく助かるのですが。何か変換か編集の方法があれば、教えて頂きたいです。

  • いきなりPDF to DataでWordに変換したのですが、文字化けします

    いきなりPDF to Dataを使いWordに変換したのですが、一部の文字が文字化けします。 何か原因があるのでしょうか?どうすれば文字化けしなくなりますか?

  • PDFをPDF to DataでWordやExcelにすると

    PDFをPDF to DataでWordやExcelにすると文字化けする。良い方法有りませんか、又は良いソフトを紹介ください。

  • いきなりPDF to Data Professional 2の性能

    いきなりPDF to Data Professional 2でPDFからWordやExcelに読み取ると条件がよくとも半分以上文字化けしてしまいます。 元々の性能の問題でしょうか。また最近PPTへの変換機能が追加されたソフトもでた様ですが、使用に耐えるものなのでしょうか?

  • PDFについて

    PDFファイルをWordやExcelのように編集できるソフトってありますか??スキャナーでWordやExcelに変換しても文字化けしたり上手に編集できません。PDFファイルを直に編集できるソフトを知っている方、教えてください。

  • いきなりPDF TO DATA PROFESSIONAL2について

     いきなりシリーズを購入し、PDFファイルをエクセル2003、ワード2003で読み取りしましたが、フォントが悪いのか? ほとんど化け文字で読み込んでしまいます。文字だけの簡単な変換なのにはっきり言って使い物になりません。何か設定方法があれば教えてください。それともこのソフトの認識率はたいしたことはないのでしょうか?

  • 「いきなりPDF to Data」文字化けばかり

    PDFファイルをエクセルに変換しようと「いきなりPDF to Data2」を使用しましたが、90%程度が文字化けになり、困っています。

  • いきなりPDF to Dataについて

    私こと、今般ソースネクスト社の「いきなりPDF」と「いきなりPDF to Data」を同時購入し、早速使用を試みましたが、うまく使いこなせず困っています。具体的に申し上げますと、(1)「いきなりPDF」でテキストファイルをPDFファイルに変換し、それを「いきなりPDF to Data」で再度テキストファイルに変換し直すと、概ね良好に変換されますが、(2)「いきなりPDF」でワードの文書をPDFファイルに変換し、それを「いきなりPDF to Data」で再度ワードに変換した場合にうまく変換されません(=ディスプレイ上は、一見、通常のワード文書に変換されたように見えますが、実は、テキストボックスが組み合わされた状態になっております)。つきましては、(2)のケースでうまく変換できる工夫がありましたら、ご教示願います。なお、上述の(1)、(2)の作業は、一見無意味のようですが、仕事の関係で、このような作業が必要である旨、念のため申し添えます。

  • いきなりPDF to Dataでうまく変換できません。

    いきなりPDF to Dataを使用し、PDFファイル(文章)をWordへ変換しようと手順通りに作業をしているのですが、まったく違うもの(地図)が変換されます。しかも違うPDFファイル(文章)で試してみても、文章ではなく地図が変換されます。しかも変換されるものはなぜか同じ地図となります。ネット上のpdfファイルをコピーして保存し、それをWordに変換しようとしているのですが、それが原因なのでしょうか? すいません。誰か教えてください。

  • PDFとword

    PDFファイルをwordに変換すると文字化けしてしまいますが、PDFファイルをwordに変換して作成し、作成終了後PDFに戻すことは可能ですか?

専門家に質問してみよう