締切済み

Adobe Acrobat の日本語認識能力

2008/07/03 01:08

紙文書や書籍をPDF化し、スキャナで読み取ったあと検索できるようにしようと思っています。そこでadobe acrobatを使おうと思うのですが、日本語の認識能力は、他のOCRソフトに比べどの程度のものなのでしょうか？もし低いのならば、どうやって認識能力を高めることができるのでしょうか？

hheeiittaa
お礼率10% (3/29)

その他(ソフトウェア)
回答数1
ありがとう数0

みんなの回答 （1）
専門家の回答

みんなの回答

te20
ベストアンサー率35% (14/40)

2008/07/03 02:00 回答No.1

Acrobat 7のOCRは「読んde!!ココ」のエンジンを使っているます。Acrobat 8のOCRのエンジンが何かは分かりませんが、使った感触では7のときと変わらないようなので、同じエンジンを使っていると思われます。ただ、最新のエンジンではないので、それ以上の精度を求めるのであれば、市販のOCRを使うのが良いと思います。ただ、原稿の種類によりますが、最新のものを使っても、100％近くの認識率にはなりませんので、検索目的であればほどほどのところで満足しておくのがよさそうです。経験的には、段組が複雑だったり、雑誌のように背景に色がついていたりすると、認識率が落ちるようです。

関連するQ&A

adobe acrobatのメリットは？
　よく、スキャナを購入すると、adobe acrobatが同梱されています（例えば、ScansnapやCanon　DR　２５１０C等）が、どういうメリットがあるのかわかりません。たしかに、便利な機能があるのはわかるのですが・・・　acrobatが付いていないスキャナでも、ｐｄｆは作れますし、ocrもできます。　acrobatが同梱されているスキャナでも、acrobatを使わないで、他のソフトでもｐｄｆを作れると思います（例えば、DR　２５１０CならCapturePerfect3.0だけでもｐｄｆができる？とおもうのですが）。　単に、文書をスキャンして電子化して保存したいというだけの場合、どういうメリットがあるのでしょうか？実際に使ってみての感想でも結構です。　何もわからない素人の質問ですが、よろしく、ご教示のほど、お願いいたします。
- ベストアンサー
- プリンター・スキャナー
Adobe Acrobat…
Adobe AcrobatはＰＤＦファイルを作成するソフトですよね。 …といっても、具体的にどういうことができるのか今一つイメージできません。例えば雑誌や書籍のページをスキャナで取り込むと、ＰＤＦファイルができるのでしょうか。その他ＰＤＦファイルの働きについてお教えいただければと思います。さらに…、 Adobeのサイトを見ようとしても「サーバーが見つかりません」と出ます。どうしてなのでしょう。
- ベストアンサー
- その他(ソフトウェア)
アドビアクロバットのOCR機能について
アドビアクロバット（目下,無償版）でPDFファイルを読みこんでテキストを取り出すことをやっているのですが、その機能等についてお尋ねします。いわゆるOCRのツール(?)なのですが。文書ファイルがワードとかTeX経由で作成されていてそれをPDFに変換されている場合、テキスト部をマウスでドラッグすると反転してコピーと貼り付けでテキストの取り出しができます。これはOCRの機能なのでしょうか。一方でコピー機でドキュメントを読み込んでPDFにした場合、上記のような機能にならないようです。ドキュメントがやや斜めになっているとかだからそれができないのでしょうか。それとも自分のアクロバットにOCR機能がないからでしょうか（つまり前段のテキスト取り出しはOCRではないということ？）アドビのアクロバットはフリーのものでもOCR機能はあり、ということでしょうか。それとも有償版でないとダメということでしょうか。よろしくお願いします。
- 締切済み
- その他Adobe製品
Adobe Acrobatが文字化けをする原因
Adobe Acrobatについて質問です。日本語フォントを含んだDocumentをPDFに書込みしたもののうち外人（英語版PDF Reader）が文字化けして読めない場合があります。 PDFは画像と認識していましたが、OCR機能もある故、フォントの有無に影響を受けるのでしょうか？ PDFを作成する際に日本語フォントの埋め込みが必要なのでしょうか？その場合は埋め込み方も含めてアドバイスをいただければ幸いです。
- 締切済み
- その他（インターネット・Webサービス）
Adobe Acrobat 5.0について
こんにちは。 Word(2003)で作成したデータをAdobe Acrobat 5.0にドラッグしてPDFに変換したいのですが、ドラッグして画面移行の途中で、下記のようなメッセージが表示されてしまいます。ファイルの種類がサポートされていないかファイルが壊れている(電子メールの添付文書として送信され正しくデコードされなかったなど)ため、Acrobatでは'ファイル名'を開けません。 Adobe PDF　文書を作成するには、元のアプリケーションに移動してから、文書をAcrobat Distiller　プリンタで印刷するか、Microsoft Office　のメニューにある Acrobat　メニューを使用します。なぜこのようなメッセージが表示され、PDF変換が出来ないのでしょうか？？お判りになる方、ご教授願います。
- ベストアンサー
- その他(ソフトウェア)
Acrobat 7.0 Standard 日本語版について
Acrobat 7.0 Standard 日本語版を購入しようと、ネットで検索していたら、Acrobat 7.0 Standard 日本語版と、Acrobat 7.0 Standard 日本語版 (AC) のふたつがあることが分かりました (AC)がつくのとつかないのではどういった違いがあるのでしょうか？金額も1万円以上も異なるので、大きな違いがあるとは思うのですが・・・ Acrobat 7.0 Standardを購入してしたいことは、通常のワープロ文書をＰＤＦ化したいということです。よろしくお願いします
- ベストアンサー
- オフィス系ソフト
Adobe Acrobatについて
Adobe Acrobatの購入を考えています。 Standard と　Proがありますね。スキャナで取り込んだ画像を、PDFに変えるだけなのですが、ProでなくてもStandardでできるでしょうか？　 JPEGをPDFに変換できるでしょうか？　 Standard と　Proの大きな違いは何でしょうか？よろしくお願いします。
- 締切済み
- その他(ソフトウェア)
Adobe Acrobat 4.0の使い方
Adobe Acrobat4.0を使用しています．スキャナで取り込んだデータをWebに公開しようと考えています．でもファイルサイズが大きく掲載出来る状態にありません．例としてＡ４裏表２ページなのに１０Ｍぐらいになってしまいます．これはスキャナで取り込んだ時のファイルサイズが原因なのかＰＤＦを作成する際の圧縮する設定（あるかどうかも理解してません）が悪いのかまったくわかりません．ＰＤＦのファイルサイズを小さくすることと，できれば画質はあまり落ちない程度のやり方をどなたか教えてください．また参考になる本やＵＲＬありましたら併せてお教え願えればありがたいです．
- ベストアンサー
- その他(ソフトウェア)
至急よろしく！Adobe Acrobat 8でスキャンの際範囲指定ができない！
すみませんが、なるべく大至急よろしくお願いします。基本的なことで申し訳ありませんが、文書（日本語文章）をPDFで取り込む方法を教えて下さい。 Acrobat 8 Standard　で、ファイル-PDFの作成-ファイル-スキャナで、画面を出すと「スキャナ」のほかに「プレビュー」ボタンがないため、範囲指定ができません。従って、文書の中で範囲指定した必要部分だけをスキャンしたいのですが、関係のない部分まで出てきてしまいます。どうしたらよいでしょうか？尚、私のパソコンには、Adobe製品では、他にReader 8とPhotoshop Elements 6　他社製品では、「読んでココ！」がインストールされています。
- ベストアンサー
- その他(ソフトウェア)
Adobe Acrobat 7.0 StandardによるPDF作成時の設定について
Adobe Acrobat 7.0 Standard についての質問です。シートフィーダー付のスキャナーで取り込んだマルチページTIFF画像(1)(白黒2値,600dpi A4,CCITT Group4圧縮)を、Adobe Acrobat 7.0 Standard で設定を [環境設定-PDFへの変換-TIFF-白黒圧縮-JBIG2(劣化あり)]で読み込み、PDF形式で保存(2)すると、元のマルチページTIFFファイルと比較して容量が2/3くらいになります。このPDFファイルの全ページを、OCRを使用してテキストとして認識[設定言語:日本語-PDFの出力形式:検索可能な画像(非圧縮)-ダウンサンプリング:最低(600dpi)]の処理をした後に、保存しなおす(3)と、元のマルチページTIFFファイルと比較して容量が1/3～1/5くらいになるにもかかわらず、最初のPDFファイルから画像の劣化は全くありません(見分けがつきません)。具体的にいうと、A4白黒10ページのある文書の場合、 (1)マルチページTIFF(白黒2値,600dpi A4,CCITT Group4圧縮): 1575 KB (2)PDF-無処理(JBIG2劣化あり): 1014 KB (3)PDF-OCR処理(圧縮??): 431 KB ここで2つ質問があるのですが、 I. (1)から(2)で容量が減少するのはJBIG2圧縮のおかげだと思うのですが、(2)から(3)で容量が減少するのはなぜなのでしょうか？ II. また、マルチページTIFFをPDFに変換する際、OCR処理を経ずに(2)から(3)のような圧縮?を実現することは出来ないでしょうか？(ダウンサンプリングは無しで) 全ページのOCR処理はすごく時間がかかるのですが、現状では、ファイルの容量を減らすために仕方なく実施しています。また、マルチページTIFFをスタートにしなくても構わないので、紙の白黒書類を上記と同等以上に圧縮してPDFとする方法をご存知でしたら、ご教授願います。よろしくお願いします。
- 締切済み
- その他(ソフトウェア)

Adobe Acrobat の日本語認識能力

みんなの回答

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

Adobe Acrobat の日本語認識能力

みんなの回答

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録