• ベストアンサー

印刷物を元原稿と照合するためのソフト

印刷物を元原稿と照らし合わせ、相違点を表示してくれるようなソフトを探しています。 (原稿はほとんど文字なので)OCRなどを使ってみましたが認識精度が悪くいまいち実用的ではありませんでした。 今もっているスキャナとパソコンを使って、なるべくならソフトを用意するだけでできるのが理想です。 どなたか心当たりがありましたら、ぜひお教え下さい。

質問者が選んだベストアンサー

  • ベストアンサー
  • web_cats
  • ベストアンサー率20% (193/953)
回答No.2

ANo1です。 お使いのスキャナの解像度が低すぎます。 600dpi程度では新聞の活字の認識は2~3割程度しょう。 これではそもそも画像を比較するにもその機能が果たせません。 スキャナの解像度が現在を使いの物より数倍の物を使うことをお勧めします。 回答者は事務用のスキャナで雑誌をスキャンしましたが600bpi程度ではかなり大きい文字でないとOCRの認識は甘いです。 加えてデザイン用の3000bpiを超えるスキャナで試したところOCRの認識は9割以上ヒットしました。 スキャナをデザイン用高解像度に変更することで解決できます。 高解像度スキャナ http://fujifilm.jp/business/printing/colorwf/scannercamera/lanovia/feature.html http://www.mustek.com.tw/Japan/product.html

TOOOOOOOO
質問者

お礼

ご回答のおかげでどうにかいきそうです!!!ほっとしました。 ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • web_cats
  • ベストアンサー率20% (193/953)
回答No.1

>今もっているスキャナとパソコンを使って、 現在の環境とTWAINを通るので結局いたちごっこです。 >認識精度が悪くいまいち実用的ではありませんでした 現在お使いのスキャナーの性能やソフトが分からないと何ともいえません。 それから原稿の文字の大きさや活字なのか手書きなのか環境にもよります。 全体的な環境を全て記述すれば回答者のみなさんもアドバイスできます。

TOOOOOOOO
質問者

補足

【原稿状態】 すべて活字です。大体新聞文字くらいの大きさ(10p程度)小さいもので5p程度の文字サイズです。 縦横書き混合、日英(仏)語混合です。 プリントアウト、またはコピー1回の鮮明さです。 【スキャナ】 Canon Scan F5000 / FujiDocucentre Color a250 / ScanSnap 【PC】 Windows XP pro 【OCRソフト】 Dcument Express Editor for ScanSnap / Acrobat7.0 Standard 【テキスト比較ソフト】 ちゃうちゃう(ベクターフリーソフトです。) こんな感じでよろしいでしょうか。分かりにくいところなどありましたら補足いたします。よろしくお願いいたします。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • OCRソフトのようなもので・・・

    例えば 原稿用紙をスキャナで読み込み 画面上でマス目に文字を位置合わせして入れ 印刷はスキャナーで読み込んだ原稿用紙を使い マスにぴったりと印字したいのですが これを実現できるソフトを探しています OCRソフトで可能なのでしょうか?

  • OCRソフトを使って原稿用紙の文字は認識できませんか

    OCRソフトを使って、文字を認識させたいと思ったのですが、原稿用紙(400字詰)の升目が邪魔をして全く認識してくれません。 原稿用紙では認識できないのでしょうか。 ちなみにソフトは読んde!!ココです。

  • OCRソフトとスキャナの相性

    OCRソフト ・「読んde!!ココ Ver.12 for Windows 体験版」 ・「e.Typist v.11.0 体験版」 スキャナ ・canoscan Lide40 原稿 ・新聞の投書欄(文字のみ) ・英語の教科書ガイド(和文・英文・写真・イラスト) 上記スキャナで、両ソフト・両原稿を試しました。 しかし、文字のご認識が多く、自分でキーボードで打ち込んだ方が早いという状態でした。スキャナ付属の「e.Typistエントリー」と大差ありませんでした。 これは、スキャナの性能に寄るのでしょうか? スキャナを買い換えれば、文字認識の精度が上がるのでしょうか? また、ソースネクストの「本格読取(1980円)」は、どうでしょうか? ご存じの方、教えてください。

  • OCRソフトウエアについて

    スキャナで読み込んだ文章などを、OCRソフトで、文字を認識しワードやエクセルに取り込むソフトですが、認識の精度が高くていいOCRソフトはどれでしょうか? スキャナはPFUのScanSnapを使っています。 このスキャナに付いていた体験版のソフトで、「読んde!!ココ」と「e.Typist」を使い比べてみましたが、後者の方が認識精度は高いように感じました。 この他に、「表OCR/文書OCR for Excel & Word」も有るようですが、いいものがありましたら教えていただきたくお願いします。

  • 正確にスキャンしてくれるOCRを探しています

    現在CANONのPIXUSMP370というプリンター兼スキャナーを使用しております ソフトはe.Typistのエントリーを使用しております 印刷文をOCRでスキャンし、 テキストデータにしたいのですが (PC内で改変できるtextファイルです、画像ではありません) OCRの精度が悪く 意味不明の文字が多数出てきます 例えば http://www.abc.com というURLが印刷物にあったとしたら OCRはhttp://wwwabccom というように認識してしまいます もっと精度の高いOCRが欲しいのですが どうすれば良いのでしょうか? 良いスキャナーに変える、あるいは 良いOCRソフトに変えるのでしょうか? また、お勧めがあったら教えてください よろしくお願いします

  • お勧めのOCRソフトを教えて下さい。

    現在、ソースネクストの本格読取2を使用していますが、 文字認識が満足できるものではありません。 スキャナーはキャノンMP810(複合機)を使用しています。 文字認識精度の高いOCRソフトを教えていただけませんか?

  • 読み取り精度の高いOCRソフト教えて下さい

    読み取り精度の高いOCRソフトを探しています。 WINDOWS98、wordを使用しており、スキャナーはあります。 以前使っていたOCRソフトは表物が苦手でほとんど使えませんでした。 このたび表のデータを多量に読み取る必要性が生じ、ソフトを導入したいと思っています。 3~4万円程度で実用性のあるソフトを教えて下さい。

  • OCRソフト e.typistエントリー

    キャノンのドキュメントスキャナーを購入しました。スキャナーには、OCRソフト「e.typistエントリー」がついていたので、それをインストールしてスキャンし、文字認識の精度を確認してみました。 私がワードで作ったドキュメントをスキャンしたところ、文字の認識度としては、85%くらいは正しく文字が認識されてました(15%が間違い)。それはよいとしても、大学の過去問題の本(通称=赤本)のページをコピーしてスキャンしてみたところ、80%くらいがわけのわからない漢字と記号の文字列が認識されたんです。自分で作成したドキュメントをスキャンするために、このスキャナーを購入したのでなく、職業上、赤本をスキャンしてPCに保存しておくために、スキャナーを買ったのに、これでは意味がありません。OCRソフトできちんとしたものを選ばないと、文字認識において不備が発生することを、以前に秋葉原の店員にきいたことがあります。 いずれにしても、このような症状は、私の操作で不足部分があるのか、設定をきちんとしていないからなのか、またOCRソフト「e.typistエントリー」自体に性能の限界があるのか、わからないのです。それがわかれば改善できるのに、と思っています。 OCRソフトに詳しい人がいれば、この症状の改善策を教えてください。お願いいたします。

  • 瞬間PDF:OCR(8,000円)アンテナハウス

    お願いします。 「瞬間PDF:OCR」(8,000円)アンテナハウス この製品の広告には、「紙原稿をスキャンしてOffice文書にOCR変換」とあります。 このソフトの用途が分かりません。 「PCに接続したスキャナーでワープロ印刷の文字を読み込み、それをWordのファイルに変換する」という理解でいいでしょうか。 もしそうだとしても、スキャナーで読み込む精度には限界があり、必ずミスが発生すると予想しますが、それは私の考えすぎでしょうか。 どうぞお教え下さい。お願いします。

  • OCRソフトについて教えて下さい

    複合機のスキャナー機能を利用し、新聞記事やデジカメで撮った文字を文字データに変換いたいと思います。 古いOCRソフト『読み取り革命 Ver.10』が手に入りました。現在 『Ver.14』までバージョンアップされているみたいですが、読み取りの認識率が高いなど決定的な相違点があるのでしょうか? また バージョンアップするには『Ver.14 バージョンアップ版』を購入すればよいのでしょうか?