• 締切済み

Adobe Acrobat の日本語認識能力

紙文書や書籍をPDF化し、スキャナで読み取ったあと検索できるようにしようと思っています。 そこでadobe acrobatを使おうと思うのですが、日本語の認識能力は、他のOCRソフトに比べどの程度のものなのでしょうか? もし低いのならば、どうやって認識能力を高めることができるのでしょうか?

みんなの回答

  • te20
  • ベストアンサー率35% (14/40)
回答No.1

Acrobat 7のOCRは「読んde!!ココ」のエンジンを使っているます。Acrobat 8のOCRのエンジンが何かは分かりませんが、使った感触では7のときと変わらないようなので、同じエンジンを使っていると思われます。ただ、最新のエンジンではないので、それ以上の精度を求めるのであれば、市販のOCRを使うのが良いと思います。 ただ、原稿の種類によりますが、最新のものを使っても、100%近くの認識率にはなりませんので、検索目的であればほどほどのところで満足しておくのがよさそうです。 経験的には、段組が複雑だったり、雑誌のように背景に色がついていたりすると、認識率が落ちるようです。

関連するQ&A

  • adobe acrobatのメリットは?

     よく、スキャナを購入すると、adobe acrobatが同梱されています(例えば、ScansnapやCanon DR 2510C等)が、どういうメリットがあるのかわかりません。たしかに、便利な機能があるのはわかるのですが・・・  acrobatが付いていないスキャナでも、pdfは作れますし、ocrもできます。  acrobatが同梱されているスキャナでも、acrobatを使わないで、他のソフトでもpdfを作れると思います(例えば、DR 2510CならCapturePerfect3.0だけでもpdfができる?とおもうのですが)。  単に、文書をスキャンして電子化して保存したいというだけの場合、どういうメリットがあるのでしょうか?実際に使ってみての感想でも結構です。  何もわからない素人の質問ですが、よろしく、ご教示のほど、お願いいたします。

  • Adobe Acrobat…

    Adobe AcrobatはPDFファイルを作成するソフトですよね。 …といっても、具体的にどういうことができるのか今一つイメージできません。 例えば雑誌や書籍のページをスキャナで取り込むと、PDFファイルができるのでしょうか。 その他PDFファイルの働きについてお教えいただければと思います。 さらに…、 Adobeのサイトを見ようとしても「サーバーが見つかりません」と出ます。 どうしてなのでしょう。

  • アドビアクロバットのOCR機能について

    アドビアクロバット(目下,無償版)でPDFファイルを読みこんでテキストを取り出すことをやっているのですが、その機能等についてお尋ねします。いわゆるOCRのツール(?)なのですが。 文書ファイルがワードとかTeX経由で作成されていてそれをPDFに変換されている場合、テキスト部をマウスでドラッグすると反転してコピーと貼り付けでテキストの取り出しができます。これはOCRの機能なのでしょうか。 一方でコピー機でドキュメントを読み込んでPDFにした場合、上記のような機能にならないようです。ドキュメントがやや斜めになっているとかだからそれができないのでしょうか。それとも自分のアクロバットにOCR機能がないからでしょうか(つまり前段のテキスト取り出しはOCRではないということ?) アドビのアクロバットはフリーのものでもOCR機能はあり、ということでしょうか。それとも有償版でないとダメということでしょうか。 よろしくお願いします。

  • Adobe Acrobatが文字化けをする原因

    Adobe Acrobatについて質問です。 日本語フォントを含んだDocumentをPDFに書込みしたもののうち 外人(英語版PDF Reader)が文字化けして読めない場合があります。 PDFは画像と認識していましたが、OCR機能もある故、 フォントの有無に影響を受けるのでしょうか? PDFを作成する際に日本語フォントの埋め込みが必要なのでしょうか?その場合は埋め込み方も含めてアドバイスをいただければ幸いです。

  • Adobe Acrobat 5.0について

    こんにちは。 Word(2003)で作成したデータをAdobe Acrobat 5.0にドラッグしてPDFに変換したいのですが、ドラッグして画面移行の途中で、下記のようなメッセージが表示されてしまいます。 ファイルの種類がサポートされていないかファイルが壊れている(電子メールの添付文書として送信され正しくデコードされなかったなど)ため、Acrobatでは'ファイル名'を開けません。 Adobe PDF 文書を作成するには、元のアプリケーションに移動してから、文書をAcrobat Distiller プリンタで印刷するか、Microsoft Office のメニューにある Acrobat メニューを使用します。 なぜこのようなメッセージが表示され、PDF変換が出来ないのでしょうか?? お判りになる方、ご教授願います。

  • Acrobat 7.0 Standard 日本語版 について

    Acrobat 7.0 Standard 日本語版 を購入しようと、ネットで検索していたら、Acrobat 7.0 Standard 日本語版 と、Acrobat 7.0 Standard 日本語版 (AC) のふたつがあることが分かりました (AC)がつくのとつかないのではどういった違いがあるのでしょうか? 金額も1万円以上も異なるので、大きな違いがあるとは思うのですが・・・ Acrobat 7.0 Standardを購入してしたいことは、通常のワープロ文書をPDF化したいということです。 よろしくお願いします

  • Adobe Acrobatについて

    Adobe Acrobatの購入を考えています。 Standard と Proがありますね。 スキャナで取り込んだ画像を、PDFに変えるだけなのですが、ProでなくてもStandardでできるでしょうか?  JPEGをPDFに変換できるでしょうか?  Standard と Proの大きな違いは何でしょうか? よろしくお願いします。

  • Adobe Acrobat 4.0の使い方

    Adobe Acrobat4.0を使用しています.スキャナで取り込んだデータをWebに公開しようと考えています.でもファイルサイズが大きく掲載出来る状態にありません.例としてA4裏表2ページなのに10Mぐらいになってしまいます. これはスキャナで取り込んだ時のファイルサイズが原因なのかPDFを作成する際の圧縮する設定(あるかどうかも理解してません)が悪いのかまったくわかりません. PDFのファイルサイズを小さくすることと,できれば画質はあまり落ちない程度のやり方をどなたか教えてください.また参考になる本やURLありましたら併せてお教え願えればありがたいです.

  • 至急よろしく!Adobe Acrobat 8でスキャンの際範囲指定ができない!

    すみませんが、なるべく大至急よろしくお願いします。 基本的なことで申し訳ありませんが、文書(日本語文章)をPDFで取り込む方法を教えて下さい。 Acrobat 8 Standard で、ファイル-PDFの作成-ファイル-スキャナで、画面を出すと「スキャナ」のほかに「プレビュー」ボタンがないため、範囲指定ができません。従って、文書の中で範囲指定した必要部分だけをスキャンしたいのですが、関係のない部分まで出てきてしまいます。 どうしたらよいでしょうか? 尚、私のパソコンには、Adobe製品では、他にReader 8とPhotoshop Elements 6 他社製品では、「読んでココ!」がインストールされています。

  • Adobe Acrobat 7.0 StandardによるPDF作成時の設定について

    Adobe Acrobat 7.0 Standard についての質問です。 シートフィーダー付のスキャナーで取り込んだマルチページTIFF画像(1)(白黒2値,600dpi A4,CCITT Group4圧縮)を、Adobe Acrobat 7.0 Standard で 設定を [環境設定-PDFへの変換-TIFF-白黒圧縮-JBIG2(劣化あり)]で読み込み、PDF形式で保存(2)すると、元のマルチページTIFFファイルと比較して容量が2/3くらいになります。 このPDFファイルの全ページを、OCRを使用してテキストとして認識[設定 言語:日本語-PDFの出力形式:検索可能な画像(非圧縮)-ダウンサンプリング:最低(600dpi)]の処理をした後に、保存しなおす(3)と、元のマルチページTIFFファイルと比較して容量が1/3~1/5くらいになるにもかかわらず、最初のPDFファイルから画像の劣化は全くありません(見分けがつきません)。 具体的にいうと、A4白黒10ページのある文書の場合、 (1)マルチページTIFF(白黒2値,600dpi A4,CCITT Group4圧縮): 1575 KB (2)PDF-無処理(JBIG2劣化あり): 1014 KB (3)PDF-OCR処理(圧縮??): 431 KB ここで2つ質問があるのですが、 I. (1)から(2)で容量が減少するのはJBIG2圧縮のおかげだと思うのですが、(2)から(3)で容量が減少するのはなぜなのでしょうか? II. また、マルチページTIFFをPDFに変換する際、OCR処理を経ずに(2)から(3)のような圧縮?を実現することは出来ないでしょうか?(ダウンサンプリングは無しで) 全ページのOCR処理はすごく時間がかかるのですが、現状では、ファイルの容量を減らすために仕方なく実施しています。 また、マルチページTIFFをスタートにしなくても構わないので、紙の白黒書類を上記と同等以上に圧縮してPDFとする方法をご存知でしたら、ご教授願います。 よろしくお願いします。

専門家に質問してみよう