• 締切済み

アクロバット7.0文書をocrで保存したい

アクロバットスタンダード 7.0を使っています。 PDFをocrに変換できるようなのですが、やり方がわかりません。 「文書 → ocrを利用してテキストとして認識 → 開始 → OK その後どうすれば良いのかわかりません。

みんなの回答

  • te12889
  • ベストアンサー率36% (715/1959)
回答No.1

そもそも「OCR」って、スキャナなどの装置で「光学的に文字を読み取った画像からテキストに変換する」みたいな作業ですので、「Adobe Reader」で開いてテキスト選択できるようなPDF文書なら、OCR作業は要らないと思いますよ。 で、ご質問の件ですが、「名前を付けて保存」したあと、選択ツールでテキストが選択できて、コピーしてメモ帳やWord文書などに貼り付けできれば、OCR作業は成功だと思います。

関連するQ&A

  • アドビアクロバットのOCR機能について

    アドビアクロバット(目下,無償版)でPDFファイルを読みこんでテキストを取り出すことをやっているのですが、その機能等についてお尋ねします。いわゆるOCRのツール(?)なのですが。 文書ファイルがワードとかTeX経由で作成されていてそれをPDFに変換されている場合、テキスト部をマウスでドラッグすると反転してコピーと貼り付けでテキストの取り出しができます。これはOCRの機能なのでしょうか。 一方でコピー機でドキュメントを読み込んでPDFにした場合、上記のような機能にならないようです。ドキュメントがやや斜めになっているとかだからそれができないのでしょうか。それとも自分のアクロバットにOCR機能がないからでしょうか(つまり前段のテキスト取り出しはOCRではないということ?) アドビのアクロバットはフリーのものでもOCR機能はあり、ということでしょうか。それとも有償版でないとダメということでしょうか。 よろしくお願いします。

  • PDFファイルから Word 2003 のファイルへの変換の仕方を教え

    PDFファイルから Word 2003 のファイルへの変換の仕方を教えてください。 Adobe Acrobat 7.0 Standard で読み込んだPDFファイルを「OCRを使用してテキストとして認識」させた後、「名前を付けて保存」「Word文書*.doc」を選択してやってみたのですが、文字化けしたり、一部が縦書きになるなど、もうむちゃくちゃな文書になってしまいます。 どうすれば、うまく変換できるのでしょうか。教えてください。 また、Adobe Acrobat 7.0 Standard で開いたPDFファイルを編集することはできないのでしょうか。 合わせてそれも教えてください。お願いします。

  • アクロバット 7.0 スタンダードのOCR変換

    スキャナで300dpi程度で取り込んだ文書ファイルをOCRでテキスト変換したいのですが、うまくいきません。「文書」より「OCRを使用して・・・」を選択してトライするのですが、数分待たされて後、「メモリが足りないか、もしくは再起動を・・」という表示が出てくるばかりです。一体どうして????? どなたか、お知恵を拝借させてください。

  • PDFをAcrobatで透明PDF化する方法

    PDFの文書を、文字選択できる状態にするため、Acrobat DC で変換したいのですが、可能なのでしょうか? というか、最適化をすれば、文字選択はできるようになるのですが、圧縮がかかると文字がぼやけて非常に汚くなってしまいます。見た目はそのままでOCR処理(透明テキスト化、と言うのでしょうか)をすることは可能なのでしょうか?または、Acrobat DCにはその機能はないのでしょうか?

  • アドビ Acrobat OCR機能について

    Professional 7.0を使っています。 OCRテキスト認識の機能を使って、文字を含んだPDFファイルをテキストとして認識したいのですが、認識されませんでした。 全く別のPDFファイルではテキストとして認識できました。 もともとPDFファイルは1つの画像として取り込まれるので、テキスト認識の機能をかければ、認識すると思ったのですが・・・。 スキャナの解像度も問題ないと思います。 なぜでしょうか。教えてください。お願いします。

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。

  • Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法

    Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法を教えて下さい

  • OCR

    読んでココなどのソフトで、デジカメや、スキャナーで読み取った文書は、文書でも画像として扱われますがOCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。文字の認識ができ編集や変更や書き直しができるわけでしょうか?

  • アクロバットのPaper Cptureについて

    アクロバットの6.0を購入しました。Paper Captureという機能のあるのを知って、紙文書をスキャンしてOCRをかけました。しかし思うように変換できません。私の目的は、得られたテキストをワードにペーストして活用することです。いろいろなノイズを拾ってしまい、困っています。OCR技術についてあまり現状を知りませんが、こういうものなのでしょうか。アクロバットではなく、OCRに特化したソフトだと、もっとうまくいくのでしょうか。 素人ですので、教えてください。

  • 透明テキスト付きPDFをバッチ処理でOCR

    中途半端に透明テキストのついたPDFがたくさんあり, バッチ処理にて新たにOCRをかけなおしたいと考えています. 手元には Acrobat 6 Professional Acrobat 7 Standard 読んdeココ Ver13 読み取り革命 Ver12 があります. Acrobat 6.0 ProfessionalのPaper Captureだと 元の透明テキストのせいかOCRがかけられません. (テキスト付きで完全な画像ファイルではないと言われます) 読んdeココはバッチ処理ができないが, 個別であれば期待した処理ができます. 読取革命はフォルダーウォッチャーという機能がありますが PDF→PDFは不可・・・ といった具合なのですが, バッチ処理でどうにかする方法はないでしょうか. 数万以内であればあらたにソフトウェア購入もできます. よろしくお願いします.

専門家に質問してみよう