• ベストアンサー

PDF をワードやエクセルに変換すると文字化けする

よろしくお願い致します。 PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか? 卒業文集の文章を、ブラザーの複合機でスキャンしpdfにしました。 それを変換ソフトを使って(変換中ocrと表示されます)ワードやエクセルにすると 文字化けしてしまいます。 どうにか文字化けしないようにするにはどうしたら良いでしょうか? ご教授下さいませ。

質問者が選んだベストアンサー

  • ベストアンサー
  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.1

>PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか? 何故でしょうって、そりゃOCRの宿命だから。 紙に印刷された白黒のパターンをもとに、何千字という辞書から正しいと考えられる文字を探すんですよ。 一文字も間違わない方が、むしろ不思議です。 もともとbrotherの添付ソフトであるプレストのOCRは認識率が低いです。 とりあえず、そんなに小さな字でなければ解像度を300-400dpiで固定し 原稿濃度を濃くしたり薄くしてスキャンして、一番認識率が高い(誤認識:文字化けの少ない) コンディションを探してください。 きれいな原稿を用意するのも、認識率を高める一つの手です。

yukirin5_2006
質問者

お礼

ご教授ありがとうございました。 OCRとはそのようになっているんですね・・・ 勉強になりました。 本当にありがとうございました。

その他の回答 (1)

  • k-josui
  • ベストアンサー率24% (3220/13025)
回答No.2

それは「文字化け」とはいいません、「誤認識」といいます。 つまりパソコンが読み違えているだけ・・・      OCRソフトの宿命です。 対策は・・・ 読み込んだ画像の明暗、濃度などの調整、OCRソフトの読み取り精度などで、多少は良くなるかも?

関連するQ&A

  • PDFからword変換で文字化け

    PDFからWORD変換で文字化けします(文章の大部分)。 ソースネクスト社のいきなりPDF2シリーズ〔いきなりPDF2(PDF作成ソフト)とPDFtoData2(PDFからWORD変換するソフト)〕を使っています。 もとからあるPDFからWORD変換した場合はもちろんのこと 〔いきなりPDF2〕を使って変換したPDFについても文字化けするのです。 これでは、いきなりPDFtoData2を使う意味が無いとさえ思うのですが・・・

  • PDFから文字化けしないテキスト変換方法は?

    スキャンスナップで自炊したPDFファイルをOCR処理や文字をメモ帳にコピペしテキストファイル化すると、どうしても文字化けしてしまいます。保存の形式も色々と試しましたが中国語みたいな漢字に変換や文字抜けが発生します。文字化けしない良い方法はありますか?ご教示よろしくお願いいたします。

  • PDFからワード・エクセルに変換すると文字化けする

    ソースネクストのPDFからワードエクセルに変換するソフトを 使用しましたが、文字化けして困っています。

  • 文字化け

    すでにプリントした状態の書類をスキャンし、PDFの形式でパソコンに取り込み、「いきなりPDF to Date 2」に取り込みましたが、文字がすべて文字化けしてしまいます。(エクセル、ワードともに) 2行しかない文章もすべて文字化けしてしまいます。購入後、1ヶ月も経っていませんが、いまだにワードやエクセル形式に変えることができません、すべて失敗です。何が原因なのでしょうか?

  • PDFをワードに変換

    Microsoft ワードの「ファイル」の「開く」でPDFのファイルを指定すると、そのPDFの内容がワードファイルとして読み込まれます。  PDFに図面が混じっている場合や余白部分にページ番号等が記載されている場合に意味不明なワード文章となることは仕方ないと思います。  しかしPDFが文章だけの場合でも、読み取ったワード文章にワードのフォントと画像(文字表す画像)とが混在する場合があります。  もう少し優れたPDF→ワード変換ソフトは開発されていないのでしょうか。元のPDFデータを一度濃く印字してOCRで読み直してから、変換した方が正確に変換される場合もあるでしょうか。

  • word 変換・excel変換ができない

    ScavSnapでスキャンしたデータをword変換・excel変換しようとしたのですが、一部のページのみの変換で、「ページ○文書に対して正しいOCR言語が選択されていることを確認してください。」となりデータを見ると文字化けしているページが殆どでした。どう対処すればよろしいでしょうか。お教え下さい。 ※OKWAVEより補足:「「ScanSnap/fiシリーズ/HHKB」商品について」についての質問です。

  • いきなりPDF to DataでWordに変換したのですが、文字化けします

    いきなりPDF to Dataを使いWordに変換したのですが、一部の文字が文字化けします。 何か原因があるのでしょうか?どうすれば文字化けしなくなりますか?

  • PDFファイルをWordかExcelに変換したい。

    PDFファイル中の文字が、なぜか少しにじんで、文字として読めるのですが、テキストとして認識しません。このような状態のPDFファイルをWordに変換するOCRソフトを教えて下さい。できたらフリーがいいですが、なければシェアウェアでもいいです。

  • ワードをPDFにすると文字化けしてしまいます

    初めてword2000で作成したものを PDFに変換させました。 すると「臏」<ヒン。月(にくづき)に賓>だけが 文字化けしてしまい、「?」になってしまいます。 この質問の画面では「臏」に化けてしまってます(汗) IME2000のパットにある文字なのですが・・・ (他の文字は、すべて正常です) distiller3.0のオプションにある 「すべてのフォントを含める」にチェックをしてから 変換させても、やはり化けてしまいます。 どうしてもこの文字が必要なのですが、 どのようにすれば文字化けせずにすむでしょうか? 教えて下さい。どうぞよろしくお願いいたします。

  • PDFファイルをEXCELファイルに変換後文字化けします

    いきなりPDF to data ProfessionalでPDFファイルをEXCELに変換するとすべてが文字化けしてしまったのですが何が問題なのか分かりますでしょうか?仕事で困っていますので宜しくお願いします。

専門家に質問してみよう