Mac OS X対応なOCRソフトはありますか?

このQ&Aのポイント
  • Mac OS Xに対応しているOCRソフトはないのでしょうか?
  • PDFファイルや画像ファイルを読み取り、テキストに変換して書き出してくれるMac OS X対応のOCRソフトを探しています。
  • 現在、Mac OS X向けのOCRソフトを探しているのですが、日本語認識やPDFの取り扱いに対応したソフトが見つかりません。
回答を見る
  • ベストアンサー

Mac OS X対応なOCRソフト何か無いですか?

Mac OS Xに対応しているOCRソフトってないのでしょうか? できれば、PDFファイルや画像ファイルなどを読み取って、その中に含まれるテキスト部分だけどテキストに変換して、PDFやEPUBファイルなどで書き出してくれる様なソフトがいいと思っています。 今度、iBooksが出ました。 iPadやiPhone、iPod touchが電子書籍リーダーとして将来有望になりつつあります。 iPad、iPhone、iPod touch、すべてAppleの商品です ところが電子書籍を作るのに向いた、肝心のOCRソフトのMac版が見つからないという、本末転倒な状態です。 Googleでかなり検索しましたが、Mac対応?というブログ記事をなど読んでいざソフトの公式サイトに移動してみると、いつの間にかMac版の開発・発売が打ち切られていて非常にがっかりする羽目になったり、PDFの取り扱いに対応していなかったり、日本語認識が非対応だったりして、どれもこれも使えそうにありません。 Mac App Storeでも探してみたら、OCRKitというのがお値段も程々で、その機能に近いものと感じましたが、これも残念ながら現状日本語に対応していないという残念な結果でした。 先日試しに、Mac OS X標準のプレビュー.appを使って、本を丸々一冊、テキストデータも画像データも全部ビットマップ扱いのまま、強引に全ページをPDFに変換(全画像を選択して、印刷メニューを開き、そのまま印刷をせずにそっくりそのままPDFとして書き出しをする方法で)してみたのですが、200dpiぐらいでスキャンしたJPEG画像を元に作成した所、iPhone 3GSで話にならないぐらい重たく、ファイルサイズもメチャクチャ肥大化して、実用性からはほど遠い状態でした。 やっぱり文章部分はテキストで、後手書きの絵や写真以外の、図表などはベクトルデータで書き出した方が軽量化できるのではという印象を感じざるを得ませんでした。 それに、それができるのであれば、写真集みたいな画像を重視するものでなければ、少々解像度を下げてもあまり影響しなくなるので、ビットマップ部分も軽量化できると感じます(潰れると一番見づらい部分は文字なので、これがテキストデータ化すればほぼ問題無し)。 特に、携帯ゲーム機のゲームを外でやるのに、ゲーム機よりも巨大で分厚い攻略本を持っていくのはナンセンスなので、ああいうのはスキャンして電子書籍にして、iPhoneなりiPadなどで読みながらその傍らやるのがスマートだと思いました。 そんなこんなで、電子書籍を導入したいのですが、それを作る為のソフトが見つからないのでどうしようもない状態です。 何か良いソフトをご存知でしょうか?

  • Mac
  • 回答数4
  • ありがとう数15

質問者が選んだベストアンサー

  • ベストアンサー
  • cliomaxi
  • ベストアンサー率33% (2921/8736)
回答No.3

>1ページずつというのがちょっと難点ですね...。 それは無料版の機能制限です。 有料版にその制限はありません。 http://solutions.weblite.ca/pdfocrx/

ZeldaLink
質問者

お礼

ありがとうございます。 とりあえず無料版を試用してみて、目的に合っているのならば有償版の購入を考えます。 お値段も安いみたいですし、良いと思います。

その他の回答 (3)

  • chieffish
  • ベストアンサー率44% (1149/2554)
回答No.4

キヤノンの1世代前の安物複合機(スキャナ+プリンタ)持ってます。 スキャンは滅多に使用しませんが、保存時に傾き補正や日本語OCR、高圧縮PDF の機能もあります。スキャンした3.5MBの書類に摘要したら152KBになった。 Acrobatも使ってますがこんなことはできないような・・・

ZeldaLink
質問者

お礼

ありがとうございます。 それはすごいですね。 けどその為にわざわざスキャナ買うのもなんだし...ソフトウェア的にできると嬉しいんだけど、難しいんでしょうね...。

  • cliomaxi
  • ベストアンサー率33% (2921/8736)
回答No.2

PDF限定で無料(1ページずつと言う制限あり)のアプリもあります。 PDF OCR X http://solutions.weblite.ca/pdfocrx/languages.php http://favapple.net/2010/03/30/194 このためだけに購入と言うのは現実的では無いのですがAcrobatにもその機能があります。 http://tv.adobe.com/jp/watch/i-didnt-know-acrobat-could-do-that/8146/

ZeldaLink
質問者

お礼

ありがとうございます。 1ページずつというのがちょっと難点ですね...。 となると、Acrobat以外選択肢がなくなるのでしょうかねぇ...。 AppleはiBooksという立派なシステムを構築しておきながら、その為のバックボーンがないのが非常に悲しいと感じます。 Apple製品で使う為のデータは、できればMacで自給自足したいところなので、と思っています。

noname#242220
noname#242220
回答No.1

自炊に使われる事が多い『 ScanSnap』にエプソンの『読んde!!ココ』が添付されてます。 エプソンから販売もされてます。

参考URL:
http://scansnap.fujitsu.com/jp/
ZeldaLink
質問者

お礼

ありがとうございます。 ただ、このソフトはモノクロにしか対応していないみたいで、カラーやグレースケールの原稿をいじるには向かない感じがしますね。 自分はEPSONのプリンタを持っているので、自分の手元にもあったのですが、これではちょっとと思う感じだったので、パスしていました。 後、完全版はWindowsでしか出ていないみたいで、それが残念に感じました。

関連するQ&A

  • OS 10.3.対応で欧文が読み取れるOCRソフトについて

     教えていただきたいことがあります。  先日修理に出していたPCが却って来たのですが、頼みもしないのに(そういうものらしいのですが)、Mac のOSが10.3.にversion-upされていました。  それはそれで有り難かったのですが、困ったことに以前から使っていたTexte BridgeというOCRソフトが使えなくなりました。主にフランス語の文献の読み取りに使用していたソフトです。日本でも、欧文対応のOCRソフトが市販されてはいるのですが、どれも高価で私にはとても手が出ません。  それで、フランスで販売されているものを購入しようと思うのですが、今のところOmnipage Xというものが目に留まっています。  もしどなたか、Mac OS 10以降に対応するOCRソフトで欧文文書も読み取れるものをご存知、あるいはお使いの方がいらっしゃいましたら、教えていただけないでしょうか。  よろしくお願いします。  

    • 締切済み
    • Mac
  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • PDFのOCR化でファイルサイズが小さくなる理由

    すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。

  • PDFのOCR化でファイルサイズが小さくなる理由

    以下の質問に回答して下さった方、有り難うございました。 何かの手違いで、お礼を言うおうとしたら、会員IDまたはパスワードが違うといわれ、はねられてしまいます。 なので、これを利用してお礼を言わせていただきます。 ------------------------------- 暇なときにでも すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  • ocrソフトの一押しを教えて下さい。

    紙をスキャンしてテキストに、PDF(テキスト付き)にする、エクセルにするってどれが使いやすいソフトですか? たくさんありますが、皆さんの一押しを教えて下さい。読んでも有るし、タイピストもって事でなく一押しだけ効かせて下さい。勿論業務用OCRは抜きでお願いします。

  • PDF内の画像文字からテキストを抽出できるOCR

    現在、PDFファイルで英文を翻訳機にかけたいと思っているのですが、20~30年前の部品のデータシートで何かスキャナーからこのデータシート資料を取り込んだらしく、文字が画像としてしか認識されずテキストをコピペすることができないのです。 文字はすべてアルファベットなどで構成されています。多少スキャン時にページが傾いている感じがあるくらいでOCRソフトのRealReader Lite 7.0でjpegファイルから”スマート認識”でとりだそうとしたのですが、 すこし誤変換が多いような気がしました。 このようなすべて画像で構成されているPDFファイルから文字のとりだしやすいOCRソフトなどご存じの方いらっしゃいませんでしょうか? ぜひ、教えて頂きますよう、お願い致します。

  • pdfのOCR化について

    全くの初心者です。 代行業者に本のスキャンサービスを頼み、オプションでOCRをつけてもらいました。できたファイルをソニーリーダ ー用に濃さや余白など最適化(これをしないとはっきりと読みにくい)し、ダウンロードしたらOCRが使えません。 説明では、スキャン時にOCR化するので、それを最適化するとOCRが無効になるということでした。画像のみのpdf? ではこれにOCRをかけるには、どのようなソフトがありますか?有償で構いません。 よろしくお願いいたします。

  • OCRの無料ソフトはありませんでしょうか?

    あるご老人から、住所録の整理を頼まれました。内容は、約100人分の住所を電子データとして、入力してほしいとのことです。予算は、あまり持っておられないようです。そこで、持っておられるメモをOCRソフトで読み込もうと思っています。そこで、無料ソフトの”OCR”を探しています。どなたか、詳しい方、教えてください!!