• ベストアンサー

e.TypistエントリーでOCR

Cannonのスキャナに附属の「e.Typistエントリー」で文字認識をさせ、いろいろな文書をテキスト化しています。文字認識の精度ですが、あちこち誤認識があり、まあこんなものか、といった程度のものです。 今度、何日にもわたって大量の文書をOCRでテキスト化することにしましたが、問題はその認識の精度です。e.Typistの製品版ならもっと認識率が高いのでしょうか。それとも付加機能が充実しているだけで認識の精度は同じですか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

Canonのスキャナーについていたのを使ったことありますが、 中々精度はいいと思いますよ。 …っていってもOCRは元の原稿の状態によるので何ともいえませんが。 比較表を見ると、製品版では600dpiでも取り込みできるようなので、 精度でいえば上になりますね…大きな文字だと関係ない解像度ですが。 機能的には、表組みの読み込みには強そうです。

参考URL:
http://www.mediadrive.co.jp/products/package/bandle/scanner/hikaku.html
beat118
質問者

お礼

参考URL見ました。精度も高くなり、いろいろな機能もあるようですね。 製品版、購入しようと思います。 ありがとうございました。

関連するQ&A

  • OCRソフト e.typistエントリー

    キャノンのドキュメントスキャナーを購入しました。スキャナーには、OCRソフト「e.typistエントリー」がついていたので、それをインストールしてスキャンし、文字認識の精度を確認してみました。 私がワードで作ったドキュメントをスキャンしたところ、文字の認識度としては、85%くらいは正しく文字が認識されてました(15%が間違い)。それはよいとしても、大学の過去問題の本(通称=赤本)のページをコピーしてスキャンしてみたところ、80%くらいがわけのわからない漢字と記号の文字列が認識されたんです。自分で作成したドキュメントをスキャンするために、このスキャナーを購入したのでなく、職業上、赤本をスキャンしてPCに保存しておくために、スキャナーを買ったのに、これでは意味がありません。OCRソフトできちんとしたものを選ばないと、文字認識において不備が発生することを、以前に秋葉原の店員にきいたことがあります。 いずれにしても、このような症状は、私の操作で不足部分があるのか、設定をきちんとしていないからなのか、またOCRソフト「e.typistエントリー」自体に性能の限界があるのか、わからないのです。それがわかれば改善できるのに、と思っています。 OCRソフトに詳しい人がいれば、この症状の改善策を教えてください。お願いいたします。

  • 正確にスキャンしてくれるOCRを探しています

    現在CANONのPIXUSMP370というプリンター兼スキャナーを使用しております ソフトはe.Typistのエントリーを使用しております 印刷文をOCRでスキャンし、 テキストデータにしたいのですが (PC内で改変できるtextファイルです、画像ではありません) OCRの精度が悪く 意味不明の文字が多数出てきます 例えば http://www.abc.com というURLが印刷物にあったとしたら OCRはhttp://wwwabccom というように認識してしまいます もっと精度の高いOCRが欲しいのですが どうすれば良いのでしょうか? 良いスキャナーに変える、あるいは 良いOCRソフトに変えるのでしょうか? また、お勧めがあったら教えてください よろしくお願いします

  • 相当古い e.Typist バイリンガル2 OCRソフト

    7-8年前に購入したCanonのスキャナーについてきたe.Typist バイリンガル2というOCRソフトをWindows XPのPCにインストールして使おうとしています。操作手順は間違っていないと思うのですが、文字認識すると、化け文字に近い状態となります。何かのバージョンアップが必要かとも思われるのですが、解決策をご教授ください。

  • OCRソフトウエアについて

    スキャナで読み込んだ文章などを、OCRソフトで、文字を認識しワードやエクセルに取り込むソフトですが、認識の精度が高くていいOCRソフトはどれでしょうか? スキャナはPFUのScanSnapを使っています。 このスキャナに付いていた体験版のソフトで、「読んde!!ココ」と「e.Typist」を使い比べてみましたが、後者の方が認識精度は高いように感じました。 この他に、「表OCR/文書OCR for Excel & Word」も有るようですが、いいものがありましたら教えていただきたくお願いします。

  • e.Typist が文字化けします

    ウィンドウズXPとキャノンPIXUS MP5内の 「e.Typist エントリー」をはじめて使ったのですが e.Typist を起動し、スキャンはするのですが、 TEXTの文字が文字化けします。1度アンインストーし、 またインストールしても改善しませんでした。 どうしたら直るでしょうか?教えていただきたいです。

  • OCRソフト

    最新のスキャナーのハンドル品(e.Typistエントリー)とe.Typist バイリンガル97とではどちらが認識精度がいいのでしょうか。調べる方法はないのでしょうか。

  • OCRソフトとスキャナの相性

    OCRソフト ・「読んde!!ココ Ver.12 for Windows 体験版」 ・「e.Typist v.11.0 体験版」 スキャナ ・canoscan Lide40 原稿 ・新聞の投書欄(文字のみ) ・英語の教科書ガイド(和文・英文・写真・イラスト) 上記スキャナで、両ソフト・両原稿を試しました。 しかし、文字のご認識が多く、自分でキーボードで打ち込んだ方が早いという状態でした。スキャナ付属の「e.Typistエントリー」と大差ありませんでした。 これは、スキャナの性能に寄るのでしょうか? スキャナを買い換えれば、文字認識の精度が上がるのでしょうか? また、ソースネクストの「本格読取(1980円)」は、どうでしょうか? ご存じの方、教えてください。

  • e.Typistで表(つまり罫線枠の多い文章)を読み込むときのコツを教えて下さい

    e.Typist V11.0 体験版を使い始めました。 【利用環境】 スキャナー:HP Photosmart 3210(オールインワン) OCR ソフト:e.Typist V11.0 体験版 ドライバー:HP Photosmart 3210 TWAINドライバ 【現象(困っていること)】 紙に印刷された、枠組みの多い住所録をスキャナーで読み込み、e.Typist V11.0 体験版上に表示・文字認識させたところ、ほとんど正しく認識してくれない。(認識率は、たぶん半分以下です。) 【読込み対象の印刷物】※白地に黒文字の2色構成 縦に7本、横に3本の太い罫線の入った住所録 フォントサイズは項目ごとに異なり6~10ポイント 文字種は日本語(漢字・ひらがな・カナ・数字混在) 【OCRソフト(e.Typist V11.0)の設定】 (デフォルト設定のまま) スキャン方式:通常スキャン スキャンタイプ:(たぶん自動) 解像度:200dpi 濃度:自動 ※ 縦横文字の認識方向は正しいです。 【教えて欲しいこと】 上記のような、枠線の多い印刷物の文字を正しく認識させるコツをご存知の方、助けてください! または、別のOCRソフト(無料お試し版を入手できるもの)で推奨のものがあれば、教えて下さい。 【補足】 自分では、 1)印刷物レイアウトの問題か(文字は鮮明です) 2)TWAINドライバで読込み時の精度の問題なのか 3)OCRソフト上の設定(チューニング)の問題か 4)OCRソフトの限界なのか 切り分けができません。 ただ罫線があることがある程度影響して、極端に認識率が落ちているように感じています。(罫線を無視して読み込む設定があればいいのですが・・・) どんなアドバイスでも結構ですので、教えていただければ助かります。

  • OCR

    読んでココなどのソフトで、デジカメや、スキャナーで読み取った文書は、文書でも画像として扱われますがOCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。文字の認識ができ編集や変更や書き直しができるわけでしょうか?

  • お勧めのOCRソフトを教えて下さい。

    現在、ソースネクストの本格読取2を使用していますが、 文字認識が満足できるものではありません。 スキャナーはキャノンMP810(複合機)を使用しています。 文字認識精度の高いOCRソフトを教えていただけませんか?