• ベストアンサー

カタログをデータベース化するのに最適なOCRソフトは?

OCRという便利なソフトがあることを教えていただきました。 仕事で使う、機械のカタログを読み込ませて 文字情報は、エクセルに取り込みデータベース化しようと考えています。 使い勝手の良いソフト・読み取り精度の良いソフトを教えてください! 今の所、スキャンは、CanonのMP830複合機があるので使用予定です。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

>スキャンは、CanonのMP830複合機があるので使用予定です これがあるなら、キャノンに相談しましょう。ソリューションとしてお願いすればいいです。 それが最もよいです。大手複合機メーカーは、それぞれソリューション部門を持っているので、それぞれオリジナルのアプリを開発しています。特にスキャナー+OCR+データーベースは、最も古くからあるソリューションです。20年位前からありますね。 何せバイトでその仕事していました。今じゃ考えられない、情報処理会社で住所録を作っていましたね(86系 DOS/V機486マシンOS2を使って、と言ってもわかんねだろうなあ~)。 業務用(ソリューション)と、市販の大きな違いは、DBと処理速度にある。10年くらい前だと、OCRエンジンに差があり、認識率の問題があったが、今はパソコンとスキャナーの速度が上がって、そんなにでない。 また、フォーマットを決めて、読み込むので、かなりの識字率になっている。 速度の面は、たとえば富士ゼロックスの業務用マシンだとA0サイズの白黒画像の読み取りで10秒前後で、DBに格納するのに10秒かからない。つまりほとんどストレスを感じないで、連続的にDBに格納していて、後でバックグランドでOCRをすればいい。 富士ゼロックスでも、リコーでもエプソン、キャノンでも同じソリューションをおこなっているので、マシンを選ぶというよりも、できる事のサービスを選ぶ事になる。 値段はソフト代だけで100万~1000万円くらいを覚悟しないとだめ。その代わり、市販で構築するよりも、絶対の認識率と効率化が計れる。市販だと格納先の構築だけで、そのつなぎの部分を自分で設計して、構築する必要がある。その辺を考えてみました? ちなみに、15年くらいの前のバイト先の識字率ですが、5、6ptの文字がA4にびっしりあり、ところどころ挿絵がある状態で1ページあたり、1,2文字の間違えです。業務用だと15年までもそのくらいの精度がありました。 まあ別売りだと下記のがあります。 http://biz.mediadrive.jp/wre01/

5gatu2009
質問者

お礼

ありがとうございます。 とてもそこまでの予算はないです。 仕事の片手間に、何とかしたい!!という希望なので 読み取り革命Liteのバージョンアップ版だと エクセルに落とせるようですが・・・ ちょっと考えてみます。

その他の回答 (2)

  • draft4
  • ベストアンサー率21% (1275/6017)
回答No.3

OCRは文字変換ソフトだからデータベース化とは別です データベースはエクセルでいいでしょう。 どのソフトも識字率が80%を超えないから、そのままだとデータベースになりませんよ

5gatu2009
質問者

お礼

ありがとうございます。 エクセルぐらいしか自分が使えないので そうするつもりです。 キャノンのプリンタについていたソフトでもそこそこ識字したので 市販のソフトでもいけそうな気がします。 不景気の折、1万円を超えると周囲の目が厳しくて・・。 所詮、以前の紙データ整理なので。 頑張ってみます。 皆様、ありがとうございました。

  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.1

>使い勝手の良いソフト・読み取り精度の良いソフトを教えてください! 認識率100%のソフトは存在しません。 まずは、MP830付属の読取革命liteで試してください。 webにカタログデータがあれば、テキストデータを取ることも可能かと思うのですが、お持ちのカタログは古いものだけなのですか?

5gatu2009
質問者

お礼

ご回答ありがとうございます。 早速、引っ張り出してみましたが ワードに保存されてしまって使いにくい!! 断念です。

関連するQ&A

  • お勧めのOCRソフトを教えて下さい。

    現在、ソースネクストの本格読取2を使用していますが、 文字認識が満足できるものではありません。 スキャナーはキャノンMP810(複合機)を使用しています。 文字認識精度の高いOCRソフトを教えていただけませんか?

  • OCRソフトでエクセル

    紙の表スキャンして、またはPDFファイルの表を エクセルに変換するのに適したOCRソフトのお奨めを教えてください。 スキャナーはキャノンの複合機PIXUS-MP500 PCはXP、ペンティアム4、メモリー512メガです。 読取革命のトライアル版で試したのですが、 罫線はエクセルに変換されるのですが、データ(文字列)が すべてテキストボックスになって全く意味のない状況でした。 初めて、スキャナーを手にしたので、勝手がわからないのですが、 そこからセルにデータを移管?する方法があるのでしょうか? そのあたりもご教授願えると幸いです。

  • OCRソフトについて

    スキャナーはHPのpsc750(複合機)のものですが、これでスキャンした画像データをExcelにOCRするには、どの様なソフトが良いのでしょうか? 僕はWordにOCRされたものは見たことがあるのですが、セルとか無いので割りと自由に変換されていると思います。 しかしExcelの場合、ちゃんとセルに変換されるんですかね? あと、誤字の確立は、やはり高価なソフトほど減るのでしょうか? 操作方法ですが、素人でも簡単に出来ますかね? お薦めのソフト、定番ソフトがありましたら教えてください。 よろしくお願いします。

  • PDFのOCR結果の編集について

    ご質問させて頂きます。 会社の複合機でPDFのOCRスキャンをしているのですが、ご認識してしまった、 文字を検索するとき便利なように、正しい文字に編集したいのですが、 AdobeReaderでは不可能でしょうか? AdobeReaderソフト内で出来ないのであればフリーソフトで探しております。 ご回答よろしくお願いいたします。

  • OCRについて教えて下さい。

    会社の資料やPDFをOCRを使って文字認識させて目的の語句がどこかに記載されて いないか検索したいのですが、『読んでココ』、『読み取り革命』等、いくつか有るOCRソフトで 一番認識率の高い優れたソフトは何でしょうか? また、どうやら会社で使っているリコーの業務用コピー複合機にもOCR機能が付いている ようですが、こんな大きくて高価な機械についているOCRの性能はやはり優れているでしょうか? 大きな機械でのOCRは使った事が無いので分かりません。 実際に使った事の有る方は、感想も教えて下さい。 よろしくお願いします m(_ _)m

  • 正確にスキャンしてくれるOCRを探しています

    現在CANONのPIXUSMP370というプリンター兼スキャナーを使用しております ソフトはe.Typistのエントリーを使用しております 印刷文をOCRでスキャンし、 テキストデータにしたいのですが (PC内で改変できるtextファイルです、画像ではありません) OCRの精度が悪く 意味不明の文字が多数出てきます 例えば http://www.abc.com というURLが印刷物にあったとしたら OCRはhttp://wwwabccom というように認識してしまいます もっと精度の高いOCRが欲しいのですが どうすれば良いのでしょうか? 良いスキャナーに変える、あるいは 良いOCRソフトに変えるのでしょうか? また、お勧めがあったら教えてください よろしくお願いします

  • OCRソフトについて

    先日キャノンのCanoScanLide90を購入しましたが、添付のOCRソフトの認識力がとても悪く、印刷物でも正しく認識することができません。何か、良いOCRソフトはないでしょうか。  また、はがき(年賀状)をOCRソフトから住所録ソフトまたはエクセルに移したいと考えていますのでそれも簡単にできるソフトや方法があれば教えてください。よろしくお願いします。

  • OCRソフトについて

    OCRソフトの件で質問します。 知人からスキャナー付きのプリンター(キャノン Multi passc50) を譲ってもらったのですが、 OCRソフトが付いておらずOCRソフトを購入しようと思うのですが どういうソフトが良いのかわかりません。(初心者なので) どういうOCRソフトの選べば良いのか教えて下されば幸いです。 出来れば、文字・罫線が正確に、読み取った後あまり文字修正しなくて良いソフトがあればよいのですが。 スキャナー:キャノン Multi passc50 PC:NEC PC-VC5503E メモリ:256MB ハードディスク空き容量:98.25GB

  • キャノン エプソン どちらのOCRソフトが実用的?

    複合機プリンタには、OCR(文字自動認識)ソフトが同梱されている機種がありますが、 これはどの程度実用的なのでしょうか? キャノンでは「読取革命Lite」というOCRソフトが同梱されている機種があります。 エプソンでは「読んde!!ココパーソナル」というOCRソフトが同梱されている機種があります。 ・新聞の切り抜きやパンフレットなどの活字を、テキストデータに変換したい。  この目的には、キャノンとエプソンと どちらのOCRソフトが実用的に使えますか?  (認識率はどちらも似たようなもの?) ・もしインクが切れていた場合でもスキャナは使えるのでしょうか?  (キャノンのプリンタではだめのようですが)。 エプソンのM-750Cというプリンタを長年愛用してきましたが、寿命のようです。 それでいろいろ調べてみたら、OCRソフトというものがあるようですので、質問させていただきました。 よろしくお願いいたします。

  • OCRソフト e.typistエントリー

    キャノンのドキュメントスキャナーを購入しました。スキャナーには、OCRソフト「e.typistエントリー」がついていたので、それをインストールしてスキャンし、文字認識の精度を確認してみました。 私がワードで作ったドキュメントをスキャンしたところ、文字の認識度としては、85%くらいは正しく文字が認識されてました(15%が間違い)。それはよいとしても、大学の過去問題の本(通称=赤本)のページをコピーしてスキャンしてみたところ、80%くらいがわけのわからない漢字と記号の文字列が認識されたんです。自分で作成したドキュメントをスキャンするために、このスキャナーを購入したのでなく、職業上、赤本をスキャンしてPCに保存しておくために、スキャナーを買ったのに、これでは意味がありません。OCRソフトできちんとしたものを選ばないと、文字認識において不備が発生することを、以前に秋葉原の店員にきいたことがあります。 いずれにしても、このような症状は、私の操作で不足部分があるのか、設定をきちんとしていないからなのか、またOCRソフト「e.typistエントリー」自体に性能の限界があるのか、わからないのです。それがわかれば改善できるのに、と思っています。 OCRソフトに詳しい人がいれば、この症状の改善策を教えてください。お願いいたします。

専門家に質問してみよう