• ベストアンサー

文字化けしないOCRアプリ

スマートフォン(iPhon4S)利用ですが、 カメラで撮った文章をOCRでPDF化できるアプリを探してます。 もちろん完璧に近いものは求めていません。認識率が高く、文字化けが少ないアプリがありましたら、ご紹介ください。 無料有料問いません。

noname#206454
noname#206454

質問者が選んだベストアンサー

  • ベストアンサー
  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.1

私も色々試しますが、まず無理なようです。 Acrobat付属のOCRでも、写真から文字を拾い出すのは難しいです。 写真は、人の目では黒白を判別できますが、写真となったらダメなのですよ。 [例]  外に干してあるワイシャツも取り込んだワイシャツも人の目には真っ白ですが、写真にすると室内のものは真っ黒に写ります。  文字も光が多く反射している黒い文字は人の目には黒く見えますが、写真に取ると灰色や白になってますよ。  ⇒すべて : 目の錯覚画像 まとめ 【面白い、おもしろい画像】 - NAVER まとめ( http://matome.naver.jp/odai/2131022599702771401/2131022651502780503 )  ⇒色が。。。 : 目の錯覚画像 まとめ 【面白い、おもしろい画像】 - NAVER まとめ( http://matome.naver.jp/odai/2131022599702771401/2131022619502775003 )  人間の目は、いとも簡単にその補正をしてくれますが、カメラでは無理なのです。 (逆じゃないです。!!!)下の例で言うと、現実にこのような風景を見たときに人の目は、AとBは異なる色だと判断できますが、カメラ(機械)には、全く同じ色としか認識できないのですよ。  それが文字だったら・・・  どうしてもスキャナでスキャンするしかありません。  間接照明で、撮影するテキストの前面に均一に光が当たるようにして、遠くから望遠でうまく撮影し、それを画像ソフトでニ値データーに減色できれば、OCRで読み込むことは出来るかもしれません。実際に、そこまで手をかければOCRで読み込むことが出来ます。  従って、OCRと言うより、人の目に勝る画像ソフトを開発しないと無理でしょうね。

noname#206454
質問者

お礼

ご回答ありがとうございます。 リンク先、見ましたが驚きました。 これだけいろいろなデジタル技術が進んでても、OCRは一向に進化しないのはこのような理由からなのですね。 当面(というよりずっと!?)スキャンしてコピペするしかないですね…。

その他の回答 (4)

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.5

>最初のリンク、AとBが同じなんて信じられません。  ですが、現実世界では明らかに異なる色と認識できないと困るのですが、カメラは区別していない全く同色に撮ってしまう。その写真を見た人間は異なる色だと知ることが出来る。  色とは、「その部分に白色光が当たった時にどの波長の光を反射/吸収するか」という、その物体固有の表面の性質です。そこからどんな光が目に届いているかじゃないです。  人の目では、視細胞どおしを連結する水平細胞やアマクリン細胞を用いて、隣の色とどう変化しているかと、その周囲の変化とを総合して、実際にそれが何色かを演算処理してその【色!!】の結果を脳に送っている。目、自体が頭脳---発生学的にも脳の一部が皮膚に向かって伸びていって、表皮を巻き込んで目を作る。---なのですから、極論すれば目で見て脳に送られる時点でOCR化されている。  Johnny5君の目は、どう見たってテレビカメラですから、あの環境ではOCR化できないでしょうね。私は、仕事で英語の論文を翻訳することがあるのですが、そのときはスキャンしてOCRで英文に直して、翻訳で概略を得ることがありますが、カメラでは無理ですね。ペーパーブックならまだしも、光沢紙に印刷してあったら無理です。  唯一の方法は、No.1で説明したように、そのための撮影環境を作るしかないのです。専用の光源をもつスキャナカメラが市販されています。

noname#206454
質問者

お礼

サイドのご回答有難うございます。 やっぱり現時点ではスキャンしてOCRしないとだめですねー。 進化をのぞみます!

  • cliomaxi
  • ベストアンサー率33% (2921/8736)
回答No.4

問題は色では無く形だと思うが・・・。 原因は日本語ですよ。 アルファベットなら大文字小文字合わせても52文字しかありません。 平仮名、片仮名だけで既に100を越えますし、漢字や更には人名に使われる様な旧字体を加えれば数千数万の単位。 それでも日進月歩と言うか10年前に比べれば文字の認識率は格段に上がっています。 と、言ったところでEvernoteかな。

noname#206454
質問者

お礼

ご回答ありがとうございます。 なるほど。日本語は用いる文字種も数すごいですが、漢字も複雑な形態です。 やっぱり今は地道にスキャンか手動入力するしかないようですね…

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.3

No.1です。 >これだけいろいろなデジタル技術が進んでても、OCRは一向に進化しないのはこのような理由からなのですね。  OCRではなく、カメラです。中学校あたりで、カメラと目の構造を並べて、レンズ-水晶体、絞り-虹彩、フィルム-網膜と対応を示した図がよくありますが、カメラと目はまるで異なります。まず、シャッター--デジカメだと走査---がない。例の図( http://matome.naver.jp/odai/2131022599702771401/2131022619502775003 )のAとBを同じ色だと認識できない、そもそもしっかり見えているのは中心だけなのに、全体を理解できる・・・など、二つはまるで異なるものです。  カメラで本に書かれている文字を読み取ることは、実は今の技術では無理なのです。  ⇒INPUT Short Circuit - YouTube( http://www.youtube.com/watch?v=Pj-qBUWOYfE )   映画ショートサーキットのひとコマです。  それにしても、目とはすばらしいですね。

noname#206454
質問者

お礼

ご回答ありがとうございます。 最初のリンク、AとBが同じなんて信じられません。 錯視については私も本当におもしろいなと思ってます。それもひとつな人間な高度のメカニズムです。 カメラは人間の目の構造を真似ていますが、それでも機械は人間の身体の複雑な構造を超えることはできないと思ってます。 「ショートサーキット」のシーン、このロボットが本をOCRしている?のでしょうか(笑)

  • yoratomi
  • ベストアンサー率57% (4/7)
回答No.2

質問者も完璧は求めてないって書いてますしねー。 とはいえ、私もサイトを紹介するしかできませんが。 http://app-liv.jp/customizations/barcodes/1325/ OCRは、フリーのエンジン(OCRパーツ)があるので、フリーなものは、どうしても識字率が低い(似たりよったり)です。 フリーのOCRパーツを使いソフトを作ったこともありますが、識字率もさることながら、使い勝手が今ひとつだったり。 自分のところで、OCRを開発し、なおかつ性能がいいモノが理想ですが・・・。 WinやMacで、OCRソフトを開発しているメーカーのiPhoneヴァージョンがあると、多少識字率も上がると思いますが・・・。 かと言って有料のも、実は中身がフリーのOCRだったりする可能性もあるので、なんとも。

noname#206454
質問者

お礼

ご回答ありがとうございます。 アプリを使った人のコメントだと「騙された」というのが多いですね。だったらなぜ売るのか?と思いますが…。完璧じゃなくてもいいんです、本当に!!

関連するQ&A

  • 手書き文字のOCRで認識率が高いものを探しています

    手書き文字のOCRで認識率が高いものを探しています。 実際に読み取りたいものは(当然ながら)今は紙に書かれた文字です。 それらはすべてA4用紙ですが、いったん複合機でPDF化をしようと思います。 そのPDFを大量に読み込ませて順次OCRしたいのですが、どのようなソフトかサイトを使うと認識率が高いでしょうか。 AI-OCRは有料になるでしょうが、そこまでのものは求めていません。 Google Lensがちょうどよいのですが、それだとせっかくPDFファイルになっていてもカメラ撮影をしなければならないようで断念しました。(枚数が多いのと、カメラ持ち込みNGの作業場のため)

  • OCR機能付のPDF閲覧iPadアプリを探してます

    iPad用のアプリについて質問させて下さい。 iBookやi文庫HDなどPDFを閲覧できるアプリは沢山ありますが、アプリで表示中のPDF内の画像に対してその場でテキスト認識>クリップボードにコピーできるものを探しています。 文章と写真の混在した専門誌をスキャニングしたJPGをPDF化していますが、それをアプリで閲覧しつつ、気になる文章をクリップボードにコピーしてメモ帳に貼り付けるなどしたい訳です。 最初からOCR処理を施したPDFにしていないのには、スキャン後に画質調整したり解像度を自由に変えたかったり、OCR機能のある高額なソフトでもOCR機能が完璧じゃなく専門書なので誤変換が怖いなどといった理由でJPGのままPDF化しています。 私が知りたいのは先に書いたように、閲覧中に気になったページ(の一部など)だけテキスト抽出できるようなアプリがあるのかどうかです。 もしそのようなアプリをご存知であれば教えて頂ければ大変ありがたいです。 よろしくお願いします。

  • 完全認識率のスキャナソフト、OCRソフトは?

    ないのでしょうか?? 「e.Typist」と「読んで!ココ」を試用しましたが、テキストの100%の認識率ではありませんでした。 特に雑誌などの独特の字体など不完全です。現状はどのソフトもこうなのでしょうか? 誤認識されたものは、PDFファイルにも、そのまま反映されてしまうのでしょうか? また、完璧とまではいかなくても、完璧に近い、これは満足!というスキャナーやOCRのソフトがあればご紹介ください。

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • OCRについて教えて下さい。

    会社の資料やPDFをOCRを使って文字認識させて目的の語句がどこかに記載されて いないか検索したいのですが、『読んでココ』、『読み取り革命』等、いくつか有るOCRソフトで 一番認識率の高い優れたソフトは何でしょうか? また、どうやら会社で使っているリコーの業務用コピー複合機にもOCR機能が付いている ようですが、こんな大きくて高価な機械についているOCRの性能はやはり優れているでしょうか? 大きな機械でのOCRは使った事が無いので分かりません。 実際に使った事の有る方は、感想も教えて下さい。 よろしくお願いします m(_ _)m

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • OCR のベストなものを教えて下さい

    OCR のベスト(PDF からテキスト変換に使用したい)な有料ソフトを探しています。 1:読んでここ 系列と、e.typist 系列では文字化けなどの点でどちらが良いですか? 2:よい系列の場合に、具体的にどの機種・商品がよい・手頃ですか? お手数でも是非教えて下さい。 taka073011 より

  • MFCJ980 複合機のOCRについて。

    この機種のOCRで文章をワードに取り込むと、酷い文字化けで、問い合わせたら、お試しOCRとの事、ネット上に無料OCRがあり、ダウンロードしようか迷ってます。如何なものでしょうか? ※OKWaveより補足:「ブラザー製品」についての質問です。

  • PDF をワードやエクセルに変換すると文字化けする

    よろしくお願い致します。 PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか? 卒業文集の文章を、ブラザーの複合機でスキャンしpdfにしました。 それを変換ソフトを使って(変換中ocrと表示されます)ワードやエクセルにすると 文字化けしてしまいます。 どうにか文字化けしないようにするにはどうしたら良いでしょうか? ご教授下さいませ。

専門家に質問してみよう