- 締切済み
文字の一致率を出せる高性能なOCRソフト
高性能なOCRソフトで文字の一致率が何%だったのか取得できるものはないでしょうか。 日本語、英語、数字が認識できるものがいいです。 できれば無料のものがいいです。体験版でできるものでも可です。 どなたか教えていただけないでしょうか。
- みんなの回答 (6)
- 専門家の回答
みんなの回答
- papis
- ベストアンサー率70% (3742/5292)
>その文字が結果的に合っていたかはどうでもいいんです。 質問のタイトルが 「文字の一致率を出せる高性能なOCRソフト」 から、そんなことを後出しじゃんけんされても困りますね 最初から「認識・識別プロセスを可視化できるOCRソフト」とでもあれば。 >OPENCVのソースコードで なんか持って回ったような聞き方をされますね.... であれば、Tesseract OCRを当然知っているのでしょうから ご自身で仕様を理解して組むしかないと思います。
- _kappe_
- ベストアンサー率68% (1583/2308)
たとえば「6」という文字をOCRで読んだときに、字形の比較で「6」のスコアが340、「5」のスコアが278、「8」のスコアが253、「G」のスコアが188のように内部で計算された結果スコアの最も高い「6」が出力されるとして、そのスコアを見たいという要望でしょうか。 実際には個々の字形だけではなくて、前後の文脈も見て出力内容を決めているはずですけれど。
- 121CCagent
- ベストアンサー率52% (15641/30058)
>一度膨大な字体データとスキャンした >画像を比較して一致率を出した上で >最も一致率が高い文字を出力していると >思うのですが違うんですか? OCRの内部処理については詳しくないので何とも言えませんが普通はそうでしょうね。ただその一致率はあくまでOCRソフトでいえば最終結果を出すための過程の段階での話でOCRソフトでは最終結果が重要で過程はユーザー側に見える必要はないって気もしますね。
- seble
- ベストアンサー率27% (4041/14683)
我が社のソフトの一致率は97%というような事は言えますよ。 でも、あなたのお書きになっているのは、実際に使っている最中、ないし、実際にスキャンしたその文章の一致率ですよね? これは、一致しているかどうかを人間が目で見て確認しない限り数値は出せませんから、ソフト単独で、今の文章の一致率、というような数値は出せないという事です。
- papis
- ベストアンサー率70% (3742/5292)
>https://ledge.ai/reactive_int/ ここで言っている一致率の数字は、 OCRの結果と原稿の文字を開発者が目視で比較算出した結果であって、 手動で算出した数字ですよ。 そもそも現状のOCR技術は、 膨大な字体データとスキャンした画像を比較して 画像判定処理から最も近い文字を提案しますが、 >文字の一致率が何%だったのか 繰り返しになりますが、結果の成否を最終的に判断するのは、 「人間」ですから、そもそも認識率を算出する事ができません。
補足
その文字が結果的に合っていたかはどうでもいいんです。 一度膨大な字体データとスキャンした画像を比較して一致率を出した上で最も一致率が高い文字を出力していると思うのですが違うんですか? OPENCVのソースコードでそのようなものを見たことがあるのですが
- seble
- ベストアンサー率27% (4041/14683)
認識失敗したと認識できないからこそ認識失敗するのです。 認識に失敗して別の文字になっていたとしても、ソフトウェアはその間違った文字として認識したのです。つまり、間違った事が分かっていません。分かっているなら修正、他の候補にしますから。 故に、誤認識率を出せるソフトなど無いでしょう。強いて言えば、手動で直した文字数を自身で数えて、電卓にでも入力(エクセルでも)するしかないと思います。
補足
私が言っているのは1文字に対する一致率です https://ledge.ai/reactive_int/
補足
そういうことですね。一致率を出した後で一致率の高い候補から前後の文脈を読み取り適切な文字を出力するといった形をとっていると思います。 この一致率の部分を取得したいのです。