• ベストアンサー

OCR化の精度について

現在CanonのピクサスMP270の購入を検討中のものです。 ほぼこちらの商品を購入するつもりなのですが一つだけ気になるところがあります。 それは スキャナーから取り込んだ自筆の文章ををOCR化してテキストデータにしたいのですがどれくらいの精度なのでしょうか?字ははっきり言って汚いです。 ということです。 スキャナーのスペックは1200dpi CISで取り込み可でソフトは読取り革命liteを使用するとのことです。 どなたかわかる方解答宜しくお願いしますm(_ _)m

noname#125978
noname#125978

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

   過信無用 ~ 手書き文字は絶望的です ~    ふつうのスキャナーに付属のOCRソフトは、いわゆる手書き文字に 対応していません。  いくら丁寧に書かれても、活字や植字の規格には及ばないからです。    わたしは、数千枚の手書き資料を、つぎの方法で管理しています。  とりあえず、サイズや形状ごとに「連続給紙に連続番号」で保存し、 縮小印刷(A4片面に4頁)で、目録をつくります。    目録をもとに、タイトルを手打ちして、連続番号に追記します。  エクセルで一覧表を作り、必要に応じてキーワードを補足します。 (縮小画像と記憶の組合せで、たいがいは探しだせます)    なお、通常のOCR認識では、あらかじめ傾きを整え(白インキで) 汚れを消しておくのが効率的です。古い紙資料は、いったんコピー印刷 してから再読みこみすれば、精度が向上します。    わたしは、A3複合機を使っていますが、OCRはA4版以内です。  A3見開き原稿は、コピー印刷し、A4に裁断してから、あらためて OCRで読みとっています(ソフトによっては傾きの自動補正あり)。  

noname#125978
質問者

補足

お礼が遅くなってすいませんm(_ _)m投稿してたつもりでしたが出来てませんでした;; 詳しい説明やテクニックを教えて頂いてありがとうございます。 手書き文字のOCR化は難しそうなので教えて頂いた方法を試させてもらいたいと思います。 一つお聞きしたいのですがエクセルに打ち込んだタイトルがあれば必要な部分は見つかるかと思うのですが目録があった方が便利なのでしょうか?

その他の回答 (2)

回答No.3

  >エクセルに打ち込んだタイトルがあれば必要な部分は見つかる<  文書量が多い場合とか、タイトル以上に重要なキーワードについては 「目録があった方が便利」ですね。    画像タイトル一覧には、つぎのソフトが便利です。 http://q.hatena.ne.jp/1258061678#a966001  手順先後 ~ 始めにタイトルありき ~  

noname#125978
質問者

お礼

ありがとうございます。是非実践してみたいと思います!

noname#99913
noname#99913
回答No.1

OCRには1200dpiもあれば十分ですが、活字の場合でも100%とはいきません。文字サイズにもよりますが、80~90%ぐらいです。 手書きで、それも楷書でないなら、認識率はかなり低くなります。個人差もありますが、草書レベルだと30%以下ではないでしょうか。

noname#125978
質問者

お礼

回答ありがとうございます。 30%ですか;;思ったより断然低いです… 最近では雑誌とかで紙から離れよう!というような記事を見かけるので期待しすぎました↓手書きは技術的に難しいのですね。 ありがとうございましたm(_ _)m

関連するQ&A

  • 精度の高いOCRソフトウェア

    OCRソフトウェアについてお教えください。 精度の高いOCRソフトウェアを探しています。金額は高くても問題ありません。精度が一番重要です。 XeroxのDocuWorks、panasonicの読取革命Ver.15、JustSystemのOCR一発など試しましたがいまいちでした。 OCRで読み取りたい文章は、日本語と英数字の割合が1対9くらいで圧倒的に英数字が多いです。かといって、日本語もないわけではありません。 これらの条件を満たしていて、精度の高いOCRソフトがありましたらお教え願います!

  • OCRの精度が良いソフトは!?

    はじめまして。 職場でスキャナからFAX文章を画像データにして OCRで読み込ませようとしております。 しかし英文など全くうまくいかず、 かなりめちゃくちゃになるありさまです。 CANONプリンタに付属している、 読み取り革命を使用しておりますが、 何かおすすめのソフトウェアがありましたら、 お教え下さいませ。 よろしくお願い致します。

  • キャノン エプソン どちらのOCRソフトが実用的?

    複合機プリンタには、OCR(文字自動認識)ソフトが同梱されている機種がありますが、 これはどの程度実用的なのでしょうか? キャノンでは「読取革命Lite」というOCRソフトが同梱されている機種があります。 エプソンでは「読んde!!ココパーソナル」というOCRソフトが同梱されている機種があります。 ・新聞の切り抜きやパンフレットなどの活字を、テキストデータに変換したい。  この目的には、キャノンとエプソンと どちらのOCRソフトが実用的に使えますか?  (認識率はどちらも似たようなもの?) ・もしインクが切れていた場合でもスキャナは使えるのでしょうか?  (キャノンのプリンタではだめのようですが)。 エプソンのM-750Cというプリンタを長年愛用してきましたが、寿命のようです。 それでいろいろ調べてみたら、OCRソフトというものがあるようですので、質問させていただきました。 よろしくお願いいたします。

  • お勧めのOCRソフトを教えて下さい。

    現在、ソースネクストの本格読取2を使用していますが、 文字認識が満足できるものではありません。 スキャナーはキャノンMP810(複合機)を使用しています。 文字認識精度の高いOCRソフトを教えていただけませんか?

  • OCRの性能について

    OCRで英文の長文を読み取る必要があります。「読取革命」体験版で、ペーパーバックをばらしてスキャナーでPDFにしたものを読み取らせましたが、非常に不満足なできでした。「体験版」を有料版にすれば、格段に制度が上がるのなら購入も考えます。どなたかご意見、アドバイスをお願いします。

  • おすすめのOCRソフトは?

    今度、勤務先の会社でOCRソフトを購入することになったのですが、今まで使ったことがある人がいないため迷っています。取り込み精度の高いもの・機能的に使い易いものについて教えて下さい。取り込みたいものは、取引先の会社の名刺なので小型のスキャナーがセットのものが良いですが、精度的に問題があるのならソフトのみでもかまいません。よろしくお願いします。

  • OCR用紙に書き込むソフトご存知ありませんか?

    お世話になります。 OCR用紙をスキャナで読み込み、画面を見ながら文字を入力し、プリントアウトしたいのですが、そのようなソフトはありませんか? 「読取革命」があったので、もしやと思いやってみましたが、OCRソフトというのは、OCRを読み込むソフト、ということですよね。^^; WORDに変換したら、文字を入れる四角の部分までプリントされてしまうことに気がつき、唖然としました。(というか当たり前。苦笑) OCR用紙に書き込めるソフトというのをご存知の方がいらっしゃいましたら教えてください。

  • できるだけ安上がりでスキャナーとOCRソフトを使って紙媒体からテキストデータを取得したい

    【したいこと】 分厚い本(電話帳くらいの頁数です)に記載された情報をExcelシートに効率的に取り込んで管理したいです。読み取り対象の印刷物(本)はモノクロで、文字情報と枠線のみで構成されています。(画像も複雑な段組もありません。) 【やり方】 スキャナーと(できれば製品に付属版か無料版の)OCRソフトを活用して、約2000頁の印字された情報を、直接Excel出力して取得したいです。 【ポイント】 お金があまりありません。 ただ、調べてみるとA4サイズ対応のスキャナーで1万数千円~くらいのものも市販されているようです。簡易版のOCRソフトも付いているようです。 【教えてください】 1)投資金額1万円台で、上記のしたいことは実現できるでしょうか? 2)1枚の紙媒体をスキャナで読み込んで、その後Excel出力するのにだいたい何秒(何分?)くらいかかりますででしょうか? (※ご認識文字の手修正など、加工作業は一切時間に含めない場合の、単純な読取時間+Excel変換時間) 【補足】 今のところ、文字認識の精度がいいと聞いた「読取革命Lite(Canonのスキャナに同梱)」か「e.Typist(体験版)」をOCRソフトとして考えています。 上記の1)、2)を教えてください。 どうぞよろしくお願いいたします!

  • 正確にスキャンしてくれるOCRを探しています

    現在CANONのPIXUSMP370というプリンター兼スキャナーを使用しております ソフトはe.Typistのエントリーを使用しております 印刷文をOCRでスキャンし、 テキストデータにしたいのですが (PC内で改変できるtextファイルです、画像ではありません) OCRの精度が悪く 意味不明の文字が多数出てきます 例えば http://www.abc.com というURLが印刷物にあったとしたら OCRはhttp://wwwabccom というように認識してしまいます もっと精度の高いOCRが欲しいのですが どうすれば良いのでしょうか? 良いスキャナーに変える、あるいは 良いOCRソフトに変えるのでしょうか? また、お勧めがあったら教えてください よろしくお願いします

  • スキャナーのOCR機能

    キャノン家庭用複合機のプリンタのスキャナー機能を使い, テキストをPDFにてスキャンしたのですが、取り込んだ透明つきPDFの 文字ばけてしまってます。 試しに,そのPDFを1枚だけ紙で出力し、その紙を再度スキャンすると 今度は文字認識してます。 また,OCRを複合機付属のものではなく、読取革命liteでお試ししましたが 結果は同じで,テキストからでは認識せず。 紙でプリント出力のものだけ認識するようです。 (オリジナルは,無地ですが)背景色の濃淡,微妙なオリジナルフォントからのずれ,紙の厚さとか 条件が違うと思いますが、何かコツのようなものがありますでしょうか。 テキストを試しに1枚破り、実験するという手はありますが 破りたくなく、どうしものかと相談させて頂きました。 宜しくお願いいたします

専門家に質問してみよう