• 締切済み

【PDF】これはOCRなのでしょうか?

エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか?

noname#206454
noname#206454

みんなの回答

  • mrkato
  • ベストアンサー率47% (1008/2121)
回答No.1

同梱版「読んde!!ココ パーソナル」が変換しているはずです。 http://www.epson.jp/products/ai/koko/product/personal/personal.htm 製品版もエプソン販売が取り扱っていましたが、 2012年9月30日をもって販売終了となりました。 文字化け原因は、コピーを取ったPDFリーダー画面上の文字コードと、 ワードの取り扱う文字コードのモードが異なると考えられます。 日本語PDFデータ自体がフォント(活字)も含んだ形だと、 いわゆる「シフトJISかユニコード漢字か」がOSと合わない事があります。 すぐ出来る手は、一度ワードでなく、メモ帳の編集画面にペーストするか、 さらに一度保存するときに文字コードを指定し、改めて開くと思ったのですが。

noname#206454
質問者

補足

ご回答ありがとうございます。 やはりOCR化されていたのですね。 PDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままですした…

関連するQ&A

  • 【テキスト】文字化けの修正

    雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 しかしPDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままですした… 他にどのような対処方法があるでしょうか?

  • 文字化けを正常にするには

    雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 しかしPDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままでした… 他にどのような対処方法があるでしょうか?

  • PDFから文字化けしないテキスト変換方法は?

    スキャンスナップで自炊したPDFファイルをOCR処理や文字をメモ帳にコピペしテキストファイル化すると、どうしても文字化けしてしまいます。保存の形式も色々と試しましたが中国語みたいな漢字に変換や文字抜けが発生します。文字化けしない良い方法はありますか?ご教示よろしくお願いいたします。

  • 【PDF】Bullzip PDF Printer でPDF化したファイルのテキストについて

    Bullzip PDF Printerを使ってPDF化したらしいファイルがあり、 Adobe Readerで開くとPDFでは正常に日本語も表示されているのですが、 テキストで保存を実行する、もしくはテキストをコピーして テキストエディタに貼り付けを行うと一部が文字化けしてしまいます。 例えば、「金融」という言葉が「・融」となったり、「1ヶ月」が 「1ヶ・」になったりします。 正しい日本語で表示させたいのですが、何か良い方法はありますでしょうか。

  • adobeでPDFをOCR

    無料のadobe readerを使っているのですがPDFをOCR出力できますか? エクセルに出力したいです。 オフィスのバージョンは2007です。

  • PDFファイルのテキスト保存

    PDFからテキストに保存する際、通常ならコピペでできるのですが、↓のファイルの場合、文字化けしてしまいます。何かいい方法はありませんか? http://kokushi.job.affrc.go.jp/H15genkyou/H15syousai/13L.pdf

  • pdfのOCR化について

    全くの初心者です。 代行業者に本のスキャンサービスを頼み、オプションでOCRをつけてもらいました。できたファイルをソニーリーダ ー用に濃さや余白など最適化(これをしないとはっきりと読みにくい)し、ダウンロードしたらOCRが使えません。 説明では、スキャン時にOCR化するので、それを最適化するとOCRが無効になるということでした。画像のみのpdf? ではこれにOCRをかけるには、どのようなソフトがありますか?有償で構いません。 よろしくお願いいたします。

  • PDFファイルから Word 2003 のファイルへの変換の仕方を教え

    PDFファイルから Word 2003 のファイルへの変換の仕方を教えてください。 Adobe Acrobat 7.0 Standard で読み込んだPDFファイルを「OCRを使用してテキストとして認識」させた後、「名前を付けて保存」「Word文書*.doc」を選択してやってみたのですが、文字化けしたり、一部が縦書きになるなど、もうむちゃくちゃな文書になってしまいます。 どうすれば、うまく変換できるのでしょうか。教えてください。 また、Adobe Acrobat 7.0 Standard で開いたPDFファイルを編集することはできないのでしょうか。 合わせてそれも教えてください。お願いします。

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • パワーポイントからPDFにするとOCRが化ける

    パワーポイントの資料をOCRしたPDFに変換したいのですが、その方法としてOffce2007パワーポイントから印刷出力する時にPDFにしてみました。 すると、OCRしたテキストは埋め込まれているのですが、日本語が文字化けしているようで、まったく役に立ちません。。。 何かうまい解決方法をご存知の方がいらっしゃいましたら、ご教示いただけませんか? どうぞ宜しくお願いいたします。

専門家に質問してみよう