• ベストアンサー

ある、OCRソフトですが、これくらいのことも認識しません(怒)

お世話になります。 ある、OCRソフトを購入しました。 さっそく使ってみたところ、 数字の・・ -25.04   これすら、まともに、認識してくれません。 フォントサイズは、約9 なので、そんなに大きい 文字とは、言えませんが、難しい漢字ではなく、 ただの数字なのに、認識結果をみると、 2801 とかなってしまいます。 マイナス記号も、小数点も、さらに数字でさえ 間違いをしています。 現在のOCRソフトってそんなものなのでしょか? これくらいのことも出来ないのでは、売り出している こと事態、サギではないのか? というくらい思います。 正しく認識してくれるOCRがあれば、すごく 便利なのですが・・・ どなたか、 フォントサイズ・・・ ”9” 文字 ・・・・・・・ ” -25.04 ” これを、ワードに書いて頂き、それを、 画面キャプチャーして、文字の、”-25.04 ”だけを 切り抜き、JPEGで、保存。 保存したJPGを、OCRソフトに読み込ませて、 処理させて、 その結果、 テキストとして、 ちゃんと、 -25.04 と してくれる、 OCRソフトを知りませんか? すみません、宜しく御願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.5

私も1泊出張でした。 52.17 14.29 45.83 64.45 0  → -A18 0 一〇.24 30.3 18.18 812 812 338 434 7行目以外は右端揃い。 e-Typist V10.0による認識→excel(表示形式=標準、横配置=標準、その他=標準 の条件)に転送→本レスへのコピペ(copy&paste)の結果です。 5行目に中身(セル内)は →の通り-A18となっています。 6行目は中身も0で、小数は認識していないですね。 7行目は表示の通りの中身です。 これに依れば、5~7行以外は正常認識、数値認識(7行目以外)は右端揃いとなっています。 多少、認識条件設定にも依るかも知れません。 認識率が悪いので購入後あまり使っていません。各社とも体験版(2week?だったかな無料)が有りますからお使いになって見られたら如何ですか?。現在はVerUPもしているはずです。 数字以外も含め良いのが見つかったら、私も知りたいのでここに追記ください。

nariyuki
質問者

補足

Setsuyakuyaさん こんばんは。 >私も1泊出張でした。 お疲れ様です。 Setsuyakuyaさんに頼りっぱなしでは、イカン ということで、e-Typist を検索してみました。 ベクターにver11がありました。 さっそく試してみましたところ、ある条件なら なんとか使えそうです。 認識する、文字を、 確実に 0~9と、記号の . と - だけに設定。 これで、試してみました。 でも、フォント8くらいをそのまま読み込むと やっぱりダメですね! そこで、ダメもとで、読み込む画像そのものを、 他の画像ソフトで2倍に拡大して、その後、 読み込み認識させて見ました。 すると、100%の認識です。 安心して、任せられそうです。 HP、新聞、などの確実にきれいなフォントであれば、 認識する、文字を絞り込み設定しておけば結構 いけるかもしれません。 フォント大きさは、14くらいであれば、大丈夫みたいです。 (これは、他画像ソフトを使用して、前もって拡大しておいてください) では。

その他の回答 (4)

回答No.4

e-Typist Ver10持っています。 次の通りでよろしいでしょうか?。 1.MS-Wordでご指定の通りfont size=9/MS明朝 2.Print screenでキャプチャー 3.MSペイントに貼り付け/切取り/jpg保存 4.e-typist V10で画像Fileを開く/文字認識 で正常?に認識しました。(全て全角文字として) これで宜しいでしょうか?。 私もこれまで何本ものOCRソフトを購入しましたが(1つ前が「読んでココV5」、その後、各社の体験版、そして現在の物) それでも未だに文字認識能力が足りなく不満たらたらです。 誤認識が多く、結局手入力の方が速い場合が多いです。 もう一つ、翻訳ソフトの認識はもっと悪く、「訳せゴマV6」以降verUp出来ていません。 どなたか、良いソフトご存じないでしょうか?。相乗りで申し訳有りませんが‥‥。

nariyuki
質問者

補足

Setsuyakuyaさん こんばんは。 返答遅れてすみません。(出張中で、今帰りました) さて、 Setsuyakuyaさんお持ちの、e-Typist Ver10で、 見事、認識されたとのこと。 うれしい限りです。 確認の為に、もう一度お願いできますか? 次のところに、bmpファイルを、貼り付けています。 ttp___up.spawn.jp_file_up21364.bmp (頭のhは、書き足して下さい) 画像の中身は、数字です。 (13行の数字が、書かれています) このbmpファイルを、読み込んでもらい、 もう一度、e-Typist Ver10で、 正確に、テキストとして、変換してくれるのか? 見てみたいです。 変換後の数字を、ここの、新しい回答に、貼り付けて 頂ければ、本当に、正解して変換できたと確認出来ます。 9フォントより、実際は、もう少し小さい文字大きさに なります。 また、明朝体では無く、ゴシックぽい字体となります。 すみません、お願いばかりで、どうぞ宜しくお願いします。 >それでも未だに文字認識能力が足りなく >不満たらたらです。 私も、そうです。 私の場合、この数字でさえ、全然ダメなので、 もう、本当に困っています。 数字でさえ、出来ないのであれば、売り出すな! といいたいくらいです。 各メーカーは、実際の使用状況、お客の声を聞くなり 改善に、もう少し力をいれてほしいと思います。 長くなりました。

回答No.3

9ポイントの画面表示の文字ってことは、Windowsだと仮定して、1文 字の大きさがせいぜい12x6ドットですね。これでは初期状態では御 認識するのが当たり前です。しかもJPEGなんて輪郭ボケボケの形式 とは… OCRソフトは300~400dpiの白黒2値でスキャンした画像を読むように 設計されています。1つの数字は60x30ドットくらいのディテールを 持つことが期待されますので、nariyukiさんのような条件では無理 です。ま、JPEGにさえしなければ、学習機能で辞書を整備していヤ ルだけで、アッという間に正しく認識するようになるでしょうけど ね。

nariyuki
質問者

お礼

書き忘れました。 JPEGにこだわりはありません。 保存する、画像形式は、より鮮明な、bmpでもOKです。 よろしくお願いします。

nariyuki
質問者

補足

grumpy_the_dwarfさん コメントありがとうございます。 はい、確かに、JPEGでは、Bmpより、ボケると思います。 >9ポイントの画面表示の文字ってことは、 >Windowsだと仮定して、1文字の大きさが >せいぜい12x6ドットですね。 ウィンドウズですので、12x6ドットですね。 >学習機能で辞書を整備してい >ヤルだけで、アッという間に正しく >認識するようになるでしょうけど 私もそのような機能があるソフトなら大丈夫では ないかなと思います。 数字0~9、+と-、それに.(小数点)だけ、認識して くれれば、いいわけですので、学習させるのも、 手間とらず、苦労しないで、いけると思います。 その、学習機能がついている、OCRソフトには どのようなものがありますか?

  • merlionXX
  • ベストアンサー率48% (1930/4007)
回答No.2

原因は画面キャプチャーだからではないでしょうか? プリントしてスキャナーで読んだら、英字や数字であればスキャナー付録のおまけOCRソフトでも99%以上は正しく認識しますよ。 わたしのは、e-Typistのオマケバージョンですが。

nariyuki
質問者

お礼

書き忘れました。 JPEGにこだわりはありません。 保存する、画像形式は、より鮮明な、bmpでもOKです。 よろしくお願いします。

nariyuki
質問者

補足

merlionXXさん こんにちは、お世話になります。 もし、よろしければ、merlionXXさん お持ちのソフトで、・・・ 下記の要領で、試して頂けませんでしょうか? スキャナから、取り込みにしても、画面キャプチャ にしても、そんなに、画質に違いがあるとは、 思われませんので、もしかすると、お持ちの ソフトでは、下記の認識出来るのではないかと 思いまして・・・・。 どうぞ、よろしくお願いします。(すみません) フォントサイズ・・・ ”9” 文字 ・・・・・・・ ” -25.04 ” これを、ワードに書いて頂き、それを、 画面キャプチャーして、文字の、”-25.04 ”だけを 切り抜き、JPEGで、保存。 保存したJPGを、OCRソフトに読み込ませて、 処理させて、 その結果、 テキストとして、 ちゃんと、 -25.04 と してくれる、 時間あれば、どうぞよろしくお願いします。 文字、カタカナ、漢字は、あきらめています。 数字だけでも出来ればいいと考えております。

  • sachi218
  • ベストアンサー率16% (545/3288)
回答No.1

OCRに過度な期待をしないほうが いいと思います。 どれくらいの価格帯のソフトを購入 されたのか解りませんが、数字や 難しい漢字は、苦手なようです。

nariyuki
質問者

補足

経験により、そんなに期待は、していませんでした。 でも、 このくらいの数字・・・ ただの数字ですよ! ひらがなでもなく、漢字でもなく、カタカナでもなく ただの数字! 数字でさえ、認識できないって・・・ もう、期待というか、予想を超えたダメぶりです。 設定も、認識-数字に設定していても、出来ないとは (悲) しかも、手書きとか、くずれた数字ではないのですよ! HP、ワードなどにある、ちゃんとした、フォントなのです。 どうなのでしょか? 先に書いた例が出来るOCRをご存知の方 よろしくお願いします。 sachi218さん、コメントありがとうございます。 ぜひ、可能なソフト知りたいのです。

関連するQ&A

  • 画像認識(OCR)ソフトでこんなことは出来ますか?

    お世話になります。 OCRソフト(有料でもOK)で、文字を認識出来るのはありますが、次のようなことはできますか? 折れ線グラフが、書いてある(X,Y、には、数字単位が記入したある) 画像データ(JPG)があります。 これを、OCRで、数字と、グラフの線を認識させて エクセルに、折れ線グラフを再現させることは出来るのでしょうか? 自分的には、無理度98%というところです。 そのようなことが現在市販されているソフトで、可能 かどうか、教えて下さい

  • 欧文のアクセント記号が認識できるOCRソフト

    ドイツ語のウムラウト、フランス語のアクサンテギュ等の、文字の上下につくアクセント記号を認識できるOCRソフトで安価なものをご存知ありませんか? できればロシア語も判別できるとうれしいのですが。

  • OCRというものですか? 画像から、数字を認識してくれるソフトは?

    OCRというものでしょうか? 画像(JPG BMP)から、数字を認識してくれる フリーソフトは、ありますか? 使い方の理想としては、 数字(手書きでなくきれいな MSゴシック)が描いてある JPG画像もしくは、BMP画像から、 範囲をしてして、認識変換、もしくは、 その画像ファイルそのものを、ドラッグして、一括数字変換 このようなものは、ありませんか? 使用されていて、使い勝手の良いOCRソフトがありましたら、同時に教えて下さい

  • OCRソフトを使って原稿用紙の文字は認識できませんか

    OCRソフトを使って、文字を認識させたいと思ったのですが、原稿用紙(400字詰)の升目が邪魔をして全く認識してくれません。 原稿用紙では認識できないのでしょうか。 ちなみにソフトは読んde!!ココです。

  • 大量OCR

    下記のように大量文書のOCRファイリングを考えています。 (1)定型文書10種類 各数万枚から十数万枚 合計80万枚程度 (2)文字種類 すべて活字 手書きなし (3)OCR方法 文書中の特定場所のみ数字10桁+英字数桁 (4)文書の種類 伝票、帳票 サイズA4 曲がった紙はほとんどなし (5)誤認識の訂正方法 パートの派遣を利用して1枚あたり平均3秒程度の作業時間以下にしたい (6)文書の検索方法 (3)の検索結果を検索キーにしたいと思います。 AdobeReaderの検索機能を使用 検索するのは社員の不特定者 (7)保存形式 PDF 透明テキスト付き (8)スキヤナー 70枚/分 400DPI これから購入予定 (9)OCR ソフト メディアドライブWinreaderProV10 これから購入予定 (10)OCR認識に使用するパソコン 2台 一台をOCR認識用 もう一台を認識結果の訂正用にして交互に使う これから購入 何か問題点がありましたら教えていただけませんでしょうか 特に気になるのが下記の点です。 (5)誤認識の訂正方法 (6)(7)文書の検索方法 保存形式 この方法でいいのか ? (9)OCR ソフト はこのソフトでいいのか 長くなりましたがよろしくお願いします

  • OCRソフト e.typistエントリー

    キャノンのドキュメントスキャナーを購入しました。スキャナーには、OCRソフト「e.typistエントリー」がついていたので、それをインストールしてスキャンし、文字認識の精度を確認してみました。 私がワードで作ったドキュメントをスキャンしたところ、文字の認識度としては、85%くらいは正しく文字が認識されてました(15%が間違い)。それはよいとしても、大学の過去問題の本(通称=赤本)のページをコピーしてスキャンしてみたところ、80%くらいがわけのわからない漢字と記号の文字列が認識されたんです。自分で作成したドキュメントをスキャンするために、このスキャナーを購入したのでなく、職業上、赤本をスキャンしてPCに保存しておくために、スキャナーを買ったのに、これでは意味がありません。OCRソフトできちんとしたものを選ばないと、文字認識において不備が発生することを、以前に秋葉原の店員にきいたことがあります。 いずれにしても、このような症状は、私の操作で不足部分があるのか、設定をきちんとしていないからなのか、またOCRソフト「e.typistエントリー」自体に性能の限界があるのか、わからないのです。それがわかれば改善できるのに、と思っています。 OCRソフトに詳しい人がいれば、この症状の改善策を教えてください。お願いいたします。

  • 認識率のいいOCRソフト

    今度、数ヶ月かけて数千ページに及ぶ文書(日本語文字のみ・明朝体10.5ポイント横書き活字)を、スキャナで文字認識させテキスト化します。 OCRは誤認識があることは十分承知していますが、文書の量が多いので、あとで修正することはできません。どんどん入力していくだけです。とにかく認識率がいいOCRソフトを紹介してください。 eTypistエントリーは持っています。 現在購入を考えているものは、eTypistの製品版か、読んdeココです。(どちらも解像度600dpi)

  • OCRソフトのスピード

    最新の一般ユーザー向けOCRソフトでA4の紙1枚分のかな漢字文書をスキャナーで認識し、エクセルに出力し、保存するまでの所要時間はどのくらいでしょうか。OCRソフトの種類、パソコンのスペックや文字数などにもよると思いますが、だいたいでけっこうですのでご存知の方、教えていただけないでしょうか。

  • OCRソフトの精度

    現在色々なOCRソフトがありますが、精度はどのくらいなのでしょうか。 そのどれもが肉眼を超える事はないのでしょうか? 肉眼で認識出来ないような潰れた文字、擦れた文字を認識するソフトは今後 出てくるのでしょうか。 沢山のご回答お待ちしています。

  • OCRソフトについて教えてください。

    OCRソフトについて教えてください。 会社でOCRの導入を考えています。 読み込むものは、結婚式の席次表です。 普通の文章というよりは、人の名前を読み取ってほしいです。 しかもFAXで来たものがほとんどなので、 文字が粗いんですよね。 手書きで書き込みがしてあることもあります。 レビューを見た感じでは、 「読んでココ」が評判いいのかな・・? 上のような条件でも、認識してくれる優秀なソフトをご存知でしたら 教えていただきたいです。 予算は2~3万くらいで考えています。 宜しくお願いします。