• ベストアンサー

PDFでもらった文書ファイルをテキスト化するソフト?

仕事で扱う書類をPDFファイルで渡されました。 それはつまり、すでに印刷したものをスキャナーで取り込んで、PDFに変換してあるものでした。 これを、再び文字データとして扱いたいとおもうのですが、どのようなソフトがあるのでしょうか?OCRっていうのをつかうということまではわかったのですが、 高くてもやすくても(あまり高いのは困ります) 幅広く、教えていただければと思います。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1

OCRソフトを使うしかありません。 かつては無料のソフトがあり、私も持っていますが。今は配布されていません。 有償ソフトを購入するしかないのが現状です。 http://search.vector.co.jp/search?query=OCR やさしくPDF OCRなどは結構安価ではないかと思いますが。

その他の回答 (1)

noname#188325
noname#188325
回答No.2

関連するQ&A

  • PDF文書

    PDFをHTMLワード文書に変換して文字入力できるようにできますか? OCRはスキャナーの画像文書をPDFにするわけですか?

  • PDFファイルを一括して透明テキスト付PDFファイルにするソフトはありませんか?

    書類をスキャンした数千のPDFファイルがあります。このファイルを管理するために、透明テキスト付きにしてデスクトップ検索ソフトを使いたいと思います。 複数のPDFファイルをOCRにかけて一気に透明テキスト付きにしてくれるソフトはありませんか。 キーワードを引っかけられればいいので、認識精度をうるさくは言いませんが、斜めにスキャンされたものを自動修正して文字認識してくれるようであれば最高だなぁと思います。

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • PDF内の画像文字からテキストを抽出できるOCR

    現在、PDFファイルで英文を翻訳機にかけたいと思っているのですが、20~30年前の部品のデータシートで何かスキャナーからこのデータシート資料を取り込んだらしく、文字が画像としてしか認識されずテキストをコピペすることができないのです。 文字はすべてアルファベットなどで構成されています。多少スキャン時にページが傾いている感じがあるくらいでOCRソフトのRealReader Lite 7.0でjpegファイルから”スマート認識”でとりだそうとしたのですが、 すこし誤変換が多いような気がしました。 このようなすべて画像で構成されているPDFファイルから文字のとりだしやすいOCRソフトなどご存じの方いらっしゃいませんでしょうか? ぜひ、教えて頂きますよう、お願い致します。

  • PDFファイルの編集

    お世話になります。 スキャナ等で取り込んでPDF形式で保存したファイルを、取り込んだ解像度の悪いものの場合、影やゴミのようなものを後処理できれいな白黒ファイルに修正することは可能でしょうか? 今はPDFデータをまずAdobeReader7.0で読み込んでいるのですが、他のOCRで読み込むときにきちんと文字として認識できるように、 例えばPDFデータをAdobeReader7.0で読み込んだときに、表示の拡大率を上げてページコピーしてペイントなどに貼り付けたとしてもそれは見かけ上の問題だけでもとのPDFファイル自体を修正したことにはならないでしょうか? PDFファイルをコピーしてペイントに貼り付けたもの(BMP)を読み込んでPDFファイルとして取り込んである文字をテキストに変換したいのですが、きれいに文字を認識してくれません。 例えばPDFファイルに「あいうえお」とあったとしますと変換作業後は例えですが「あ;11E!?」文字化けのようになってしまいます(うまくいく箇所もあるのですが・・・)。 本格読み取りと言うソフトを使ってExcelファイルに変換しようとしています。 わかりにくい説明ですみません。 どなたか良い方法をご教授ください。よろしくお願いいたします。

  • 画像ファイルの中から 文字をテキスト化できますか?

    JPGや PDFのマニュアルなど画像化されてて 文字テキスト編集できませんよね? それの 文字編集する為に 画像ファイルの中から 文字をテキスト化できるソフトってありますか? たとえば 印刷物なら OCRソフト使えば スキャナーから印刷した文字の テキスト化はできますよね それって JPGの中の 文字や PDFの文字部分のみ 取り出すことはできるのでしょうか? ご教授おねがいいたします

  • PDFのOCR化でファイルサイズが小さくなる理由

    すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  • OCRソフトでPDF形式の表を読み込みしたいです

    複合機のスキャナー機能を使い、ワードで作った用紙をパソコンにPDF形式でデータ(文字と表)でおくりました。そしてOCRソフトでワード形式に変換しましたが表がうまく読み取れていません。(文字はだいたい読み取れました) ちなみにワード2007を使用しています 1、OCRソフトで表を読み込むのは難しいのですか? 2、OCRソフト以外に表を読み取る方法はありますか?あったら教えてください。 お手数おかけしますが回答よろしくお願いします

  • ペーパーをPDFファイルにしたい。

    WORD、EXCELなどのデータファイルをPDFに変換することは、フリーソフトでも変換する方法は分かったのですが、パーパーに印刷されたものをPDF化するにはどうすればいいのか分かりません。ちなみにスキャナは持っています。必要なソフト(できましたらフリー)や手順など素人の私にご指導宜しくお願い致します。

  • PDFファイルからテキストへ

    皆様こんにちは。パソコン初心者の者です。 スキャナーでイメージとして読み込んだPDFファイルを、テキストに変換する事は出来るのでしょうか?出来るのであれば、どうすれば良いのでしょうか?そういうことが出来るソフトはあるのでしょうか? ワードで作成した文書等から、PDFに変換した文書であれば、テキストに変換することは出来るようなのですが。

専門家に質問してみよう