• ベストアンサー

おすすめOCRについて

おすすめOCRについて いつもお世話になります。 画像をエクセルにしたいのですが、おすすめのOCRをご存知でしたらご教示いただけますでしょうか? 読み取り革命と言うのもを使用してみたのですが、スキャナーが古いせいか解像度600でも変換してみると読めない文字になってしまいました。 600以上だと画像がおおきすぎます・・と出てしまいキャンセルされます。 探したのですが、なかなかピンポイントでみつからず、どなたか精通している方のアドバイスをいただけますとありがたいです。 お試し版が在り、製品2万位であれば助かります。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • u-bot
  • ベストアンサー率58% (1736/2988)
回答No.2

まず判る範囲で回答します。 >オレん?£ 1oo eoo00エン みたいになってしまいます。 OCRの認識率を上げるには認識対象文字を絞り込むのが有効です。 カタカナと数字しか認識しないのであれば、英字やひらがな等を認識対象から除外して下さい。 それだけで「ん」とか「e」という誤読は無くなります。(別の文字に誤読するかもしれませんけど) あとほとんどのOCRは白黒の二値画像で認識します。 JPEGはカラー(グレー)なので人間にとっては非常に読みやすいです。 しかしOCRが内部で白黒画像へ変換するため文字が汚くなって読めないことがよくあります。 良い例が見つからなかったのですが、下記のページの一番最後の画像を見てください。 http://www.mis.med.akita-u.ac.jp/~kata/image/lvslice.html グレー画像を2つの閾値で二値化した時の違いを表しています。 グレー画像は人間は簡単に読めますが、このままではOCR処理できないので白黒(二値化)します。 二値化閾値は普通自動的に決めますが最適な値にならない場合があります。 左の画像のような閾値230にしてしまうと文字同士がつながったり文字潰れが発生するため誤読が多発します。 試しに手動で綺麗に二値化してから画像を保存してOCR処理してみてはどうでしょうか? とりあえず手動で二値化閾値を設定できるフリーのソフトを紹介しておきます。 ただしこのソフトは広告が画面に出てきたり情報収集するソフト(アドウェア)のため、できれば使わないで下さい。 http://www.optmedia.jp/software/S0000403.html (広告について)http://www.optmedia.jp/summary/ あと文字の大きさが新聞程度で漢字が含まれないなら400dpiでも十分かと思いますが、文字同士が接触するようなら解像度をあげる必用があるかもしれません。

yuki22
質問者

お礼

遅くなり申し訳ございませんでした。 パソコンの画面が出なくなり、新しいのを新調してました・・申し訳ありません。 u-bot様、大変貴重なアドバイスありがとうございます。 今後とも何かございましたらご教示お願いいたします。

その他の回答 (1)

  • u-bot
  • ベストアンサー率58% (1736/2988)
回答No.1

活字OCRだと ・読取革命(http://panasonic.co.jp/sn/psn/pstc/products/yomikaku/index.html) ・読んde!!ココ (http://ai2you.com/ocr/product/koko13/feature01.asp) ・e.Typist(http://mediadrive.jp/products/et/index.html) が有名です。 解像度が600dpiで読めないとのことですが普通の文字でそこまでの高解像度は過剰です。 活字OCRで重要なのは ・文字の印刷が綺麗であること(掠れたり潰れていない) ・漢字は明朝体もしくはゴシック体で、斜体文字や特殊なフォントは辛い でしょうか? できれば認識できなかった文字のみの画像(1、2文字で結構です)を見本として添付してもらえますか? それを見ればもう少し説明できるかと思います。

yuki22
質問者

補足

お返事ありがとうございます。 プロフェッショナルな方のようですね・・。 アドバイスとてもありがたいです。 ごめんなさい・・画像は手元のパソコンになくてお時間が・・。 OCRの前に10年以上の前のスキャナーでJPGにしています。 カタカナと数字の書かれた文書をスキャナーして、JPGをOCRしてみると、例えば、 オレンジシュース 10カン 100000エン というのが、 オレん?£ 1oo eoo00エン みたいになってしまいます。 スキャナー前の用紙は真っ白ではないですがきれいで、JPGも解像度600でしたら普通に読めます。 文字の大きさや密集度は、新聞テレビ番組欄くらいです。 こんな捕捉で申し訳ないです。 来週には画像を添付できますので、もしお時間がございましたらご教示いただけるとありがたいです。 お返事ありがとうございました。

関連するQ&A

専門家に質問してみよう