• ベストアンサー

PDF(画像)→日本語OCR

k_o_j_iの回答

  • k_o_j_i
  • ベストアンサー率72% (18/25)
回答No.2

残念ながら、PDFの画像ファイルに特化したOCRはないと思います。 ACROBATから「ファイル→印刷」したものをスキャンしてOCRにかけるしか手はないと思います。

関連するQ&A

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • pdfのOCR化について

    全くの初心者です。 代行業者に本のスキャンサービスを頼み、オプションでOCRをつけてもらいました。できたファイルをソニーリーダ ー用に濃さや余白など最適化(これをしないとはっきりと読みにくい)し、ダウンロードしたらOCRが使えません。 説明では、スキャン時にOCR化するので、それを最適化するとOCRが無効になるということでした。画像のみのpdf? ではこれにOCRをかけるには、どのようなソフトがありますか?有償で構いません。 よろしくお願いいたします。

  • 最も日本語の認識率のよいOCRソフトを教えてください

    最も日本語認識率の高いOCRソフトを教えてください

  • 日本語の認識率が高いOCR

    活字文字データですが画像として認識されているPDFファイルがあります。このPDFを元に文字データとしてWordやExcelで使いたいためOCRを探しています。 データは例えば住所氏名電話番号などのように日本語(漢字カタカナひらがな)と英数字です。 出来るだけ高い認識率がいいです。できればフリー、有償でも2,3万以内でないでしょうか。有償の場合試用期間があり試せるものが良いです。 パソコンはWindows7です。 よろしくお願いします。

  • PDF内の画像文字からテキストを抽出できるOCR

    現在、PDFファイルで英文を翻訳機にかけたいと思っているのですが、20~30年前の部品のデータシートで何かスキャナーからこのデータシート資料を取り込んだらしく、文字が画像としてしか認識されずテキストをコピペすることができないのです。 文字はすべてアルファベットなどで構成されています。多少スキャン時にページが傾いている感じがあるくらいでOCRソフトのRealReader Lite 7.0でjpegファイルから”スマート認識”でとりだそうとしたのですが、 すこし誤変換が多いような気がしました。 このようなすべて画像で構成されているPDFファイルから文字のとりだしやすいOCRソフトなどご存じの方いらっしゃいませんでしょうか? ぜひ、教えて頂きますよう、お願い致します。

  • 英文のOCRについて

    OSX(10.3.4)です。 スキャニングした英文をテキスト化するOCRソフトを探しています。現在、スキャナーについていたOCRソフトを使っているのですが、日本語OCRソフトなので、「H」や「E」を「且」と認識したりと、全然使い物になりません。英語モードのようなものがあるOCRソフトか、英文専用OCRソフトだと、もう少し認識率がいいのではないかと思うのですが? 1)日本語OCRソフトで英語モードがあるもの、2)英文専用(英語のソフト可)で評判のいいOCRソフト、をご存知の方は教えて下さい。

    • ベストアンサー
    • Mac
  • 日本語縦書文書のOCR

    日本語縦書の文書で、例えば外国の地名や人名などが欧文で添え書きされる場合、寝かして(90度時計回りで回転されて)記されることがしばしばあります。このような文書をOCRでそのまま読み取ると、欧文の文字列は日本語縦書きと見なされて、正確には読み取ってくれません。欧文文字列を範囲指定して、向きの異なる横書きと指定することによって読み取らせることも可能ですが、欧文文字が多い場合は非常に煩雑ですし、読み取り後の編集作業が文字列毎に必要になってしまいます。 このような縦書時の欧文を自動で認識してくれるOCRソフトウェアはないでしょうか。 通常、PDF化した後でまとめてOCR処理していますので、PDFを読み取ることが可能なソフトウェアであれば尚更有り難いです。 よろしくお願いします。

  • OCR機能のないスキャナで取り込んだPDFをOCR化できる?

    OCR機能のないスキャナで取り込んだPDFファイルが多数あります。 このPDFファイルを、OCR情報を含んだPDFファイルに変換する方法はあるのでしょうか? 要は、最初からOCR付スキャナで処理すれば良かったのですが・・・。

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。