• ベストアンサー

PDF形式の電子書籍ファイルをOCR処理したい

タイトルのとおりです。 小説や漫画など多数PDFのファイルはあるのですが OCR処理をお店に依頼するとお金がかかりますよね。 ついては、所有のPDFファイルをOCR処理することは可能なのでしょうか? また、どのソフトがオススメですか? アドビのソフトがいいらしいというのは小耳に挟んだのですが 実際にどうなのかはわかりません。 みなさん、どうぞよろしくお願いします。

  • UME555
  • お礼率90% (187/206)

質問者が選んだベストアンサー

  • ベストアンサー
  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.2

>ついては、所有のPDFファイルをOCR処理することは可能なのでしょうか? 可能ですが、 なぜする必要があるのかを再検討されては如何でしょう? >また、どのソフトがオススメですか? PDFがテキストデータを持っていればテキスト吐き出しですみますし、 画像としてのPDFからでしたら 読んでde!!ココ 読取革命 e.typist NEO などがあります。 ソースネクスト製品は、読取革命の古いものですから、お勧めしません。 古い記事ですが 日経パソコンの2006/10/23号が参考になるでしょう。 http://pc.nikkeibp.co.jp/article/NPC/20070130/260016/

UME555
質問者

お礼

何種類かソフトがありますよね 日経の記事を参考にしてみようと思います どうもありがとうございました!!

その他の回答 (1)

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1
UME555
質問者

お礼

こういうものもあるのですね どうもありがとうございました!!

関連するQ&A

  • OCR機能のないスキャナで取り込んだPDFをOCR化できる?

    OCR機能のないスキャナで取り込んだPDFファイルが多数あります。 このPDFファイルを、OCR情報を含んだPDFファイルに変換する方法はあるのでしょうか? 要は、最初からOCR付スキャナで処理すれば良かったのですが・・・。

  • pdfのOCR化について

    全くの初心者です。 代行業者に本のスキャンサービスを頼み、オプションでOCRをつけてもらいました。できたファイルをソニーリーダ ー用に濃さや余白など最適化(これをしないとはっきりと読みにくい)し、ダウンロードしたらOCRが使えません。 説明では、スキャン時にOCR化するので、それを最適化するとOCRが無効になるということでした。画像のみのpdf? ではこれにOCRをかけるには、どのようなソフトがありますか?有償で構いません。 よろしくお願いいたします。

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • 【PDF】これはOCRなのでしょうか?

    エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか?

  • 透明テキスト付きPDFをバッチ処理でOCR

    中途半端に透明テキストのついたPDFがたくさんあり, バッチ処理にて新たにOCRをかけなおしたいと考えています. 手元には Acrobat 6 Professional Acrobat 7 Standard 読んdeココ Ver13 読み取り革命 Ver12 があります. Acrobat 6.0 ProfessionalのPaper Captureだと 元の透明テキストのせいかOCRがかけられません. (テキスト付きで完全な画像ファイルではないと言われます) 読んdeココはバッチ処理ができないが, 個別であれば期待した処理ができます. 読取革命はフォルダーウォッチャーという機能がありますが PDF→PDFは不可・・・ といった具合なのですが, バッチ処理でどうにかする方法はないでしょうか. 数万以内であればあらたにソフトウェア購入もできます. よろしくお願いします.

  • PDFのOCR化でファイルサイズが小さくなる理由

    すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  • PDF形式のファイルの作り方

    某コンテストに応募したいのですが その応募要項に PDF形式で作ることとあり PDF形式以外では応募できないとのことです。 ただ、PDF形式のファイルの作り方がわかりません。 OSはWindows7 32bit版を使っています。 私の頭の中でPDFというと Adobe Readerで開くもの 閲覧専用 というイメージがあり PDFファイルの作り方が全くわかりません。 PDFファイルは何で作るんですか? 極端な話Wordで作ったものをPDFにすることはできるんですか? それとも、PDF形式にするためには、 このソフトで、原本を作成しないといけないとかあるのでしょうか? (最初はAdobe Readerで作るのかなとも思ったのですが Readerってついてるぐらいですから、完全にAdobe Readerは読み取り専用だしなと思って…) 詳しく教えてもらえると幸いです。

  • OCRソフトの活用法について教えて頂けるとありがたいです。PDFファイ

    OCRソフトの活用法について教えて頂けるとありがたいです。PDFファイルをスキャナーを通さずに、OCRソフトで読み込み、ワープロに貼り付けることは可能でしょうか。

  • PDFのOCR化でファイルサイズが小さくなる理由

    以下の質問に回答して下さった方、有り難うございました。 何かの手違いで、お礼を言うおうとしたら、会員IDまたはパスワードが違うといわれ、はねられてしまいます。 なので、これを利用してお礼を言わせていただきます。 ------------------------------- 暇なときにでも すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  •  本をPDFにしてくれる代行会社に依頼をしたいのですが 

     本をPDFにしてくれる代行会社に依頼をしたいのですが  <OCR>のオプションを使わずPDFスキャンとして依頼し 届いたPDFデーターを「OCRソフト」で文字認識処理は可能でしょうか?  また、オススメの「OCRソフト」て何でしょうか?

専門家に質問してみよう