• 締切済み

OCRの性能について

OCRで英文の長文を読み取る必要があります。「読取革命」体験版で、ペーパーバックをばらしてスキャナーでPDFにしたものを読み取らせましたが、非常に不満足なできでした。「体験版」を有料版にすれば、格段に制度が上がるのなら購入も考えます。どなたかご意見、アドバイスをお願いします。

みんなの回答

noname#139854
noname#139854
回答No.4

エプソンの「読んでココ」とソースネクストの「本格読取」を使っていますが全く問題ない精度で手放せません。 他の方が書いているように、高解像度(400dpi)で取り込み画像の補正とゴミ取り、傾きの調整はもちろん、「読んでココ」は選択範囲の文字の英語か日本語か混在かの種別設置が出来るので、これで設定します。 変換後も誤変換を修正していくと賢くなるので、うちの場合だと英数字は100%近く、漢字交じりでも95%以上は正確に変換していきます。 スキャン設定を変えてみたり(うちはフルカラーで取り込んでソフトで編集してます)、設定を見直してください。 体験版は期間が決められているだけで、性能面では変わらないと思うけど。 *「本格読取」は「読取革命」の廉価版だから同じと思いますが、読み取った結果を修正せずにそのままWordに送っていませんか? これだとあまり使い物になりません、ソフト上で修正し、コピペでWordに入れています。

  • 4610_459
  • ベストアンサー率34% (141/414)
回答No.3

印刷のつぶれ具合にもよるからね。ゴシック系の太い文字は印刷で広がってしまいやすいし 細い書体だとスキャン時に切れてしまったりする。 400dpi以上でスキャンして 傾き補正とごみ抜き 2均化した時点で、人間の目で印刷つぶれなら OCRがドンだけ性能よくても間違える。 正確に読み込ませるために2均化前の補正だけでも数十分かかるので そのまちがえを、拾い出して打ち込む こんな手間があるようなら、手で打ったほうが早い場合がある。 手で打てば分200文字はいける筈だから

takeumaya
質問者

お礼

早速の回答ありがとうございます。試してみます。

  • keithin
  • ベストアンサー率66% (5278/7940)
回答No.2

e-typistと読んでココの2つを使っていますが,いずれも体験版と製品版の性能差は極めて顕著です。 どちらもメーカホームページから最新版の30日間トライアル版が入手できますので,試してみてはいかがでしょう。 http://pac.mediadrive.jp/support/et/et_try.html http://ai2you.com/ocr/product/koko13/trial01.asp スキャナやソフトの調整によって,性能が上がったり下がったりすることはもちろんあります。 ○スキャン解像度は400以上 ○モノクロでスキャンする ○スキャン濃度はやや薄めにする ○自動傾き補正は必ず行う 長文,ペーパーバックということで表などはあまり無いと想定しますので,領域指定はお任せで大丈夫と思います。

takeumaya
質問者

お礼

ありがとうございます。参考になります。

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1

精度の向上は期待薄ですね、 私自身、やさしくPDF OCRを使っていますが、識字率は満足のいくレベルでは有りません。 他社の体験版も試しましたが、どれも精度は高くなかったですね。

takeumaya
質問者

お礼

ありがとうございます。

関連するQ&A

  • OCRソフト、「読取革命 Ver.14」と「読んde!ココ Ver.1

    OCRソフト、「読取革命 Ver.14」と「読んde!ココ Ver.13 アップデート版」どちらがお勧めか? 今、OCRソフトの購入を検討中です。 そこで、色々調べて「読取革命 Ver.14」と「読んde!ココ Ver.13 アップデート版」まで 絞り込みました。 でもこの2つ、どっちもどっちでなかなか最後の1つにまで絞れずにいます。 そこで皆さんのご意見をお聞かせ下さい! おそらくテキスト化するのは英文がほとんどになると思います(手書きではない)。 現在、OSはWindows7を、スキャナはエプソンのEP-802Aを使用しています。 よろしくお願いいたします。

  • OCR用紙に書き込むソフトご存知ありませんか?

    お世話になります。 OCR用紙をスキャナで読み込み、画面を見ながら文字を入力し、プリントアウトしたいのですが、そのようなソフトはありませんか? 「読取革命」があったので、もしやと思いやってみましたが、OCRソフトというのは、OCRを読み込むソフト、ということですよね。^^; WORDに変換したら、文字を入れる四角の部分までプリントされてしまうことに気がつき、唖然としました。(というか当たり前。苦笑) OCR用紙に書き込めるソフトというのをご存知の方がいらっしゃいましたら教えてください。

  • OCRソフトでエクセル

    紙の表スキャンして、またはPDFファイルの表を エクセルに変換するのに適したOCRソフトのお奨めを教えてください。 スキャナーはキャノンの複合機PIXUS-MP500 PCはXP、ペンティアム4、メモリー512メガです。 読取革命のトライアル版で試したのですが、 罫線はエクセルに変換されるのですが、データ(文字列)が すべてテキストボックスになって全く意味のない状況でした。 初めて、スキャナーを手にしたので、勝手がわからないのですが、 そこからセルにデータを移管?する方法があるのでしょうか? そのあたりもご教授願えると幸いです。

  • OCRソフトについて。

    PDFファイルの表等をエクセルに変換、文書をワード等に変換したいのですが、 体験版等で試しても文字化けしてしまいます。 設定方法が的確でないのか?、あるいは おすすめのソフトあれば教えてください。試したソフトは、 読んでここ、読みとり革命Ver12、イータイピストver12 です。 よろしくお願いします。

  • OCRソフトとスキャナの相性

    OCRソフト ・「読んde!!ココ Ver.12 for Windows 体験版」 ・「e.Typist v.11.0 体験版」 スキャナ ・canoscan Lide40 原稿 ・新聞の投書欄(文字のみ) ・英語の教科書ガイド(和文・英文・写真・イラスト) 上記スキャナで、両ソフト・両原稿を試しました。 しかし、文字のご認識が多く、自分でキーボードで打ち込んだ方が早いという状態でした。スキャナ付属の「e.Typistエントリー」と大差ありませんでした。 これは、スキャナの性能に寄るのでしょうか? スキャナを買い換えれば、文字認識の精度が上がるのでしょうか? また、ソースネクストの「本格読取(1980円)」は、どうでしょうか? ご存じの方、教えてください。

  • OCRソフトについて教えて下さい

    複合機のスキャナー機能を利用し、新聞記事やデジカメで撮った文字を文字データに変換いたいと思います。 古いOCRソフト『読み取り革命 Ver.10』が手に入りました。現在 『Ver.14』までバージョンアップされているみたいですが、読み取りの認識率が高いなど決定的な相違点があるのでしょうか? また バージョンアップするには『Ver.14 バージョンアップ版』を購入すればよいのでしょうか?

  • OCR化の精度について

    現在CanonのピクサスMP270の購入を検討中のものです。 ほぼこちらの商品を購入するつもりなのですが一つだけ気になるところがあります。 それは スキャナーから取り込んだ自筆の文章ををOCR化してテキストデータにしたいのですがどれくらいの精度なのでしょうか?字ははっきり言って汚いです。 ということです。 スキャナーのスペックは1200dpi CISで取り込み可でソフトは読取り革命liteを使用するとのことです。 どなたかわかる方解答宜しくお願いしますm(_ _)m

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • できるだけ安上がりでスキャナーとOCRソフトを使って紙媒体からテキストデータを取得したい

    【したいこと】 分厚い本(電話帳くらいの頁数です)に記載された情報をExcelシートに効率的に取り込んで管理したいです。読み取り対象の印刷物(本)はモノクロで、文字情報と枠線のみで構成されています。(画像も複雑な段組もありません。) 【やり方】 スキャナーと(できれば製品に付属版か無料版の)OCRソフトを活用して、約2000頁の印字された情報を、直接Excel出力して取得したいです。 【ポイント】 お金があまりありません。 ただ、調べてみるとA4サイズ対応のスキャナーで1万数千円~くらいのものも市販されているようです。簡易版のOCRソフトも付いているようです。 【教えてください】 1)投資金額1万円台で、上記のしたいことは実現できるでしょうか? 2)1枚の紙媒体をスキャナで読み込んで、その後Excel出力するのにだいたい何秒(何分?)くらいかかりますででしょうか? (※ご認識文字の手修正など、加工作業は一切時間に含めない場合の、単純な読取時間+Excel変換時間) 【補足】 今のところ、文字認識の精度がいいと聞いた「読取革命Lite(Canonのスキャナに同梱)」か「e.Typist(体験版)」をOCRソフトとして考えています。 上記の1)、2)を教えてください。 どうぞよろしくお願いいたします!

  • OCRソフトウエアについて

    スキャナで読み込んだ文章などを、OCRソフトで、文字を認識しワードやエクセルに取り込むソフトですが、認識の精度が高くていいOCRソフトはどれでしょうか? スキャナはPFUのScanSnapを使っています。 このスキャナに付いていた体験版のソフトで、「読んde!!ココ」と「e.Typist」を使い比べてみましたが、後者の方が認識精度は高いように感じました。 この他に、「表OCR/文書OCR for Excel & Word」も有るようですが、いいものがありましたら教えていただきたくお願いします。

専門家に質問してみよう