• ベストアンサー

OCR認識率をあげるコツ

OCRソフトを使い下の手順でテキストを取り出しています。 紙・PDF → 画像 → テキスト 認識率を高める画像化などのコツはありますでしょうか? 解像度、色数、設定等いろいろ試行錯誤しているのですが、oが・と認識されたりと、いまいち認識率が低くて困っています。 使っているソフトはsmartocrlite(開発会社倒産)です。

質問者が選んだベストアンサー

  • ベストアンサー
  • hirorin00
  • ベストアンサー率50% (446/884)
回答No.2

はじめまして 間違えて認識した文字を、正しく認識させるように、OCRアプリの辞書を鍛えることが必要だと思います。 それぞれのソフトによって違うと思いますが、「読んで」の場合… 「オプション」から「認識辞書の保守」「誤りパターン辞書の保守」「単語辞書の保守」これは必須です。 跡のアプリのことはよくわかりませんが、おそらく似たような設定があると思いますので、取説を御確認下さい。

new3m3u
質問者

お礼

やはり地道に辞書系を鍛えるのがよさそうですね

その他の回答 (1)

  • tom0120
  • ベストアンサー率26% (367/1390)
回答No.1

まず、画像を取り込むときの保存する解像度を、高くする。 -------------------------- 以前、雑誌で、いろんな会社のソフトの比較をやった記事があったんですが 認識率は、まだまだのようですね。 一番ちがうのは、はやり、会社ごとの差なので、 どうしても、認識率を今より高めたい場合は、 別メーカーにするしかないと思いますよ。 なので、どこのメーカーのが、認識率がいいか、 ネットなどで、もしかしたら、どこかに、比較などの情報があるかもしれませんね・・・

new3m3u
質問者

お礼

ありがとうございます。

関連するQ&A

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • EPSONのOCR認識率を上げる設定について

    EPSONスキャナーで出力したPDFファイルのOCR認識率を上げたいのですが、OCR認識率UPに関係すると思われるスキャニングソフトの設定として以下のパラメータがあると思っているのですが、他に関連しそうな設定等がありますでしょうか? ・イメージタイプ(自動、カラー、グレー、モノクロ) ・解像度(75~300、400、600、1200) ・圧縮レベル(標準圧縮、高圧縮) ・テキスト検索(対応、非対応) よろしくお願い致します。 ※OKWAVEより補足:「EPSON社製品」についての質問です。

  • 認識率のいいOCRソフト

    今度、数ヶ月かけて数千ページに及ぶ文書(日本語文字のみ・明朝体10.5ポイント横書き活字)を、スキャナで文字認識させテキスト化します。 OCRは誤認識があることは十分承知していますが、文書の量が多いので、あとで修正することはできません。どんどん入力していくだけです。とにかく認識率がいいOCRソフトを紹介してください。 eTypistエントリーは持っています。 現在購入を考えているものは、eTypistの製品版か、読んdeココです。(どちらも解像度600dpi)

  • 手書き文字のOCRで認識率が高いものを探しています

    手書き文字のOCRで認識率が高いものを探しています。 実際に読み取りたいものは(当然ながら)今は紙に書かれた文字です。 それらはすべてA4用紙ですが、いったん複合機でPDF化をしようと思います。 そのPDFを大量に読み込ませて順次OCRしたいのですが、どのようなソフトかサイトを使うと認識率が高いでしょうか。 AI-OCRは有料になるでしょうが、そこまでのものは求めていません。 Google Lensがちょうどよいのですが、それだとせっかくPDFファイルになっていてもカメラ撮影をしなければならないようで断念しました。(枚数が多いのと、カメラ持ち込みNGの作業場のため)

  • 完全認識率のスキャナソフト、OCRソフトは?

    ないのでしょうか?? 「e.Typist」と「読んで!ココ」を試用しましたが、テキストの100%の認識率ではありませんでした。 特に雑誌などの独特の字体など不完全です。現状はどのソフトもこうなのでしょうか? 誤認識されたものは、PDFファイルにも、そのまま反映されてしまうのでしょうか? また、完璧とまではいかなくても、完璧に近い、これは満足!というスキャナーやOCRのソフトがあればご紹介ください。

  • アドビ Acrobat OCR機能について

    Professional 7.0を使っています。 OCRテキスト認識の機能を使って、文字を含んだPDFファイルをテキストとして認識したいのですが、認識されませんでした。 全く別のPDFファイルではテキストとして認識できました。 もともとPDFファイルは1つの画像として取り込まれるので、テキスト認識の機能をかければ、認識すると思ったのですが・・・。 スキャナの解像度も問題ないと思います。 なぜでしょうか。教えてください。お願いします。

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • OCR

    読んでココなどのソフトで、デジカメや、スキャナーで読み取った文書は、文書でも画像として扱われますがOCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。文字の認識ができ編集や変更や書き直しができるわけでしょうか?

  • 日本語の認識率が高いOCR

    活字文字データですが画像として認識されているPDFファイルがあります。このPDFを元に文字データとしてWordやExcelで使いたいためOCRを探しています。 データは例えば住所氏名電話番号などのように日本語(漢字カタカナひらがな)と英数字です。 出来るだけ高い認識率がいいです。できればフリー、有償でも2,3万以内でないでしょうか。有償の場合試用期間があり試せるものが良いです。 パソコンはWindows7です。 よろしくお願いします。

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。

専門家に質問してみよう