• ベストアンサー

透明テキスト付きPDFファイルを作成したい

pdMaker for ScanPaper や 読んde!!ココ 等のOCRソフトでは、スキャン後、認識した文字を透明テキストにてPDFに付加し、その情報をもとに文字情報を検索できることがわかりました。 この「透明テキスト」は、adobe Acrobat 7.0でも 作成することは出来るのでしょうか。 Acrobat 7.0評価版をダウンロードしたのですが、「透明テキスト」というような項目はないようです。 なお、Acrobat7.0の メニュー→文書→透かしと背景の追加 機能が同等の機能かとも思うのですが、よくわかりませんでした。 既存のPDF形式のデータに、検索可能な文字情報を付加する方法を教えてください。

  • mmhan
  • お礼率60% (6/10)

質問者が選んだベストアンサー

  • ベストアンサー
  • neKo_deux
  • ベストアンサー率44% (5541/12319)
回答No.1

背景色が白色なら、同じ白色で文字を記入するとか。 手元にAcrobatが無いので、具体的な操作は提示できませんが。 あるいは、そういう文書を開いてみて、どういう設定なのか確認してみるとか。

mmhan
質問者

お礼

ありがとうございます。 背景色と同じ色で文字を記入ですか。 ひとつ参考になりました。 そうですね、実際"透明テキスト"付きデータを開いてみるのが一番かも知れません。おっしゃるとおりです... OCRソフトの体験版でもダウンロードして試してみます。

その他の回答 (1)

  • errata
  • ベストアンサー率30% (3/10)
回答No.2

 adobe Acrobat 7.0には確か「読んde!!ココ」と同じ(そのもの?)のOCR機能が搭載されていたと思います。  通常、スキャナ付属のドライバないしソフトでスキャニングしますが、Acrobatでスキャニングすると言っていました。そのときにOCRも一緒にかけて(かかって?)、透明テキスト付きPDFにしてしまうようです。(作業をした人の話し)  ということなので作業的には「スキャニング」のカテゴリに入るのではないでしょうか。  ただ、あまり読み取り精度が良くなくて誤認識が多かった、と作業した連中が嘆いていました。  あまり役に立たないかもしれませんが、ご参考まで…

mmhan
質問者

お礼

お礼が大変遅くなりました。申し訳ございません。 実際の作業された方からの情報、参考になりました。 あれからPDFに関する本なども読んだのですが、結局 よくわからないままです。 画像等のPDFに文字を埋め込み、全文検索の対象にしたかったのですが、現在は別の方法を考えています。 なお、透明テキストに興味がある方のために少しリンク情報を残しておきます。 透明txt付きデータのサンプルPDF http://ai2you.com/ocr/pdf/pdmfspsample.pdf PDFを利用して文書管理するには http://arena.nikkeibp.co.jp/qa/other/20020603/100595/ 透明テキスト付きPDFを作成・保存 http://ai2you.com/ocr/product/scanpaper/feature02.htm

関連するQ&A

  • 透明テキスト付きPDFをバッチ処理でOCR

    中途半端に透明テキストのついたPDFがたくさんあり, バッチ処理にて新たにOCRをかけなおしたいと考えています. 手元には Acrobat 6 Professional Acrobat 7 Standard 読んdeココ Ver13 読み取り革命 Ver12 があります. Acrobat 6.0 ProfessionalのPaper Captureだと 元の透明テキストのせいかOCRがかけられません. (テキスト付きで完全な画像ファイルではないと言われます) 読んdeココはバッチ処理ができないが, 個別であれば期待した処理ができます. 読取革命はフォルダーウォッチャーという機能がありますが PDF→PDFは不可・・・ といった具合なのですが, バッチ処理でどうにかする方法はないでしょうか. 数万以内であればあらたにソフトウェア購入もできます. よろしくお願いします.

  • PDFからテキストだけ抜き出すには

    OCR機能のついたフリーソフトのクセロReaderZeroを使ってテキストの埋め込まれたPDFファイルを作りました。ここからノートパッドかワードにテキストだけコピーしたいのですが、どのようにしたらいいのかわかりません。教えてください。(このソフトのほかにAdobe Reader 8 と Adobe Acrobat 6 をインストールしてあります。)

  • PDFファイルを検索可能型にしたい

    PDFファイルを検索可能型にしたい PDFファイルを検索可能型にしたいのです 透明テキスト付加などと言われていますが スキャナーでスキャンして作成したPDFファイルは 要するにテキスト情報が無い”絵”の状態です この状態だと ある文字が含まれるページを探すには1ページずつ開いて目だ探すしかありません しかし透明テキストが付加されているPDFファイルだと アクロバットリーダーなどの 検索機能が使えます 今時のスキャナーはPDFファイル作成時にテキスト情報を付加する機能があり これはこれで問題ないのですが その機能を持たないスキャナーでスキャンして作成したなどのPDFファイルでは 後からテキスト情報を付加してやる必要があります この機能を持ったソフトを探しているのですが なかなか見つかりません ソースネクストのものを購入しましたが あくまでもスキャナーで読み取った時に テキスト情報を付加するものであり既に出来上がっているPDFファイルには 対応しませんでした 無駄金使ってしまいました この要望にこたえられるソフトはあるのでしょうか? Docuworcusも利用していますが これもそのあたりがイマイチです・・。

  • pdfファイルのテキスト部分を書き出すことはできますか?

    タイトルの通りなんですが… 文字情報を多く含むpdfファイルのテキスト部分だけ書き出して テキストファイルとして保存することはできるのでしょうか? Adobe Acrobat 4.0 はあります。 よい方法があったら教えてください。 よろしくお願いいたします。

  • フリーソフトでPDF表示テキストを削除

    PDFから非表示テキスト情報(OCR)を削除してデータサイズを小さくしたいです。いろいろと調べてみたのですが、Adobe Acrobat を使った方法しか見つかりませんでした。Acrobatは持っていないのでフリーソフトでPDF表示テキストを削除する方法を知りたいです。宜しくお願いします。

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法

    Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法を教えて下さい

  • PDFファイルを作成するには

    初歩的な質問ですみません。 PDFファイルを作るには、アドビのアクロバットが必要なのでしょうか。 (家には「読んでココ」があるのですがそれでは作れませんでした)

  • 画像ファイル中の文字をテキスト化するソフト

    画像になっている文書の文字をテキストデータにする、2~3千円の安いソフトはないでしょうか。 今すぐ必要なのでダウンロードできるものがよいです。 PDFの文字をテキスト化したいのですが、コピーペーストしすると意味不明の記号になります。制限は何もかかってないし、文字列の選択もできます。 で、画像としてキャプチャして、テキストにできないかと思うのですが・・・Webで探して、高価なOCRソフトが見つかったのですが、の今回だけのために買うのはもったいないし・・・「読んdeココ」は、体験版だとクリップボードからのOCR機能がないので、だめでした。 よろしくお願いします。

  • PDFファイルから Word 2003 のファイルへの変換の仕方を教え

    PDFファイルから Word 2003 のファイルへの変換の仕方を教えてください。 Adobe Acrobat 7.0 Standard で読み込んだPDFファイルを「OCRを使用してテキストとして認識」させた後、「名前を付けて保存」「Word文書*.doc」を選択してやってみたのですが、文字化けしたり、一部が縦書きになるなど、もうむちゃくちゃな文書になってしまいます。 どうすれば、うまく変換できるのでしょうか。教えてください。 また、Adobe Acrobat 7.0 Standard で開いたPDFファイルを編集することはできないのでしょうか。 合わせてそれも教えてください。お願いします。

専門家に質問してみよう