• ベストアンサー

スキャナーで読み取った文章を検索するには

スキャナーからOCR機能のついたフリーソフトのクセロReaderZeroを使ってテキストの埋め込まれたPDFファイルを作りました。adobe reader 8 で文字を検索するのですが、できません。 教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
noname#235092
noname#235092
回答No.1

検索の方法がわからないのですか? それとも検索した文字が見つからないのですか? もし見つからないのならその文字が存在しないということでは?

apple2e
質問者

補足

回答ありがとうございます 検索の方法はわかります。 検索した文字が見つかりません。 文字も存在します。 READERによる文書の検索が終了しました。一致するものはありませんでした。とメッセージがでます。

その他の回答 (4)

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.5

やはり、文字も画像としてPDF化されているようですね。 だとしたら直接にしろ間接的にしろ、そのままのデザインでテキストデータをもつPDFは作れません。  画像とテキストデータをまったく別のデータとして取り出す必要がありますが、それは不可能です。

noname#235092
noname#235092
回答No.4

No.1です。 >検索の方法はわかります。 >検索した文字が見つかりません。 >文字も存在します。 了解しました。 しかしくどいようですが、文字が存在するのに検索できないということは普通に考えてまずあり得ません。 「すべてを選択」でテキスト全部を選択できますのでWordにでもコピペしてみてください。そして今度はWordで同じように検索してみるのです。AdobeReaderで検索できないのですからきっとWordでもできないと思いますがためしてみてください。 No.3の方がおっしゃるように似てるけど違う文字だったり、 No.2の方がおっしゃるように文字でないためコピペすらできなかったりしませんか?

apple2e
質問者

補足

回答ありがとうございました。 クセロReaderZeroでjpgデータをOCR変換ボタンを押せば透明テキストデータ付PDFファイルができてると思ったのですが出来ていませんでした。 OFFICE変換ツールボタンでWORD変換すれば誤変換文字がありますが文字検索可能になりました。 透明テキストデータ付PDFファイルが作りたいのですが、教えてください。 よろしくお願いします。

  • ts3m-ickw
  • ベストアンサー率43% (1248/2897)
回答No.3

OCRでテキストになっているのだとすると、文字の誤認識により正しいテキストになっていないのかもしれません。 OCRとて完全ではありませんので、貼り付けたテキストがどんな文字になってるかテキスト抽出して確認してみてはいかがでしょうか。

apple2e
質問者

補足

回答ありがとうございました。 テキスト抽出しましたら、データがありませんでした。 クセロReaderZeroでjpgデータをOCR変換ボタンを押せば透明テキストデータ付PDFファイルができてると思ったのですが出来ていませんでした。 OFFICE変換ツールボタンでWORD変換すれば誤変換文字がありますが文字検索可能になりました。 透明テキストデータ付PDFファイルが作りたいのですが、教えてください。 よろしくお願いします。

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.2

OCRは文字を抽出するソフトです。 ですから、スキャンして文字を取り出して、別途画像も切り抜いてそれを使って書類を作ってPDFにしないと、単にスキャンしてPDFにしたら、画像を圧縮しただけになってしまいます。  その証拠に、できたPDFを拡大すると文字の縁がギザギザで画像のままであることがわかると思います。

apple2e
質問者

補足

回答ありがとうございました。 クセロReaderZeroでjpgデータをOCR変換ボタンを押せば透明テキストデータ付PDFファイルができてると思ったのですが出来ていませんでした。 OFFICE変換ツールボタンでWORD変換すれば誤変換文字がありますが文字検索可能になりました。 透明テキストデータ付PDFファイルが作りたいのですが、教えてください。 よろしくお願いします。

関連するQ&A

  • PDFからテキストだけ抜き出すには

    OCR機能のついたフリーソフトのクセロReaderZeroを使ってテキストの埋め込まれたPDFファイルを作りました。ここからノートパッドかワードにテキストだけコピーしたいのですが、どのようにしたらいいのかわかりません。教えてください。(このソフトのほかにAdobe Reader 8 と Adobe Acrobat 6 をインストールしてあります。)

  • スキャナで読み込んだデータ

    スキャナで読み込んだデータをpdfにして、 テキスト検索、検索機能を使えるようにしたいのですが。 フリーのOCRソフトはありますか? スキャナはHPのオールインワンプリンタを使っています。

  • PDFファイルを検索可能型にしたい

    PDFファイルを検索可能型にしたい PDFファイルを検索可能型にしたいのです 透明テキスト付加などと言われていますが スキャナーでスキャンして作成したPDFファイルは 要するにテキスト情報が無い”絵”の状態です この状態だと ある文字が含まれるページを探すには1ページずつ開いて目だ探すしかありません しかし透明テキストが付加されているPDFファイルだと アクロバットリーダーなどの 検索機能が使えます 今時のスキャナーはPDFファイル作成時にテキスト情報を付加する機能があり これはこれで問題ないのですが その機能を持たないスキャナーでスキャンして作成したなどのPDFファイルでは 後からテキスト情報を付加してやる必要があります この機能を持ったソフトを探しているのですが なかなか見つかりません ソースネクストのものを購入しましたが あくまでもスキャナーで読み取った時に テキスト情報を付加するものであり既に出来上がっているPDFファイルには 対応しませんでした 無駄金使ってしまいました この要望にこたえられるソフトはあるのでしょうか? Docuworcusも利用していますが これもそのあたりがイマイチです・・。

  • 【スキャナ】OCRコンポーネントとは?

    WinXPからWin7にPCを変えましたが、そのときスキャナーのドライバも最新のをHPからダウンロードしましたが、Win7でスキャナを利用しようとしましたところ、以下のようなメッセージがでました。 「EPSON Scan OCRコンポーネントのバージョンアップが必要です。バージョンアップしないと、PDFファイル作成時にテキスト検索の機能が使用しません」 OCRコンポーネントがどういうものかわからないのですが、ドライバの中に含まれてないのでしょうか?単体の?ソフトなのでしょうか?でしたらバージョンアップするにはどこからそのソフトをダウンロードすればよいでしょうか? ちなみにスキャナはEPSON「GT-S600」です。

  • OCR機能のないスキャナで取り込んだPDFをOCR化できる?

    OCR機能のないスキャナで取り込んだPDFファイルが多数あります。 このPDFファイルを、OCR情報を含んだPDFファイルに変換する方法はあるのでしょうか? 要は、最初からOCR付スキャナで処理すれば良かったのですが・・・。

  • スキャナで取り込んだ画像をAdobe Acrobat 7.0でPDFに変換したい

    スキャナで取り込んだ画像を「ePmaker」というシェアウェアでPDFにしてみたのですが、 Adobe Reader 7.0で見ようとしたところ、白紙になってしまいました。 (Adobe Reader 6.0.1では正常に見ることができました。) そこで、Adobe Acrobat 7.0から直接スキャナで取り込んでPDF化することを考えています。 そのような機能はあるのでしょうか? 機能がある場合、Acrobatの何(Standard、Professional)でなら可能でしょうか。 また、もし「ePmaker」で作成したPDFファイルを正常に見る方法がありましたら 教えてください。 質問ばかりですみません。 よろしくお願いします。 【環境】 OS:Windows2000 SP4 スキャナ:Canon CanoScan FB1210U ePmaker http://www.vector.co.jp/soft/win95/hardware/se312755.html

  • スキャナーの基本知識

    スキャナーを使うに当たって、基本的な知識を、お教えいただけませんか? 本をスキャナーに掛けると、画像ファイルとして保存されるのですね? それは、何ファイルというのですか? PDFファイルやJPEGファイルとどう関係するのですか? また、文字検索や編集の為に、OCR変換するのは、上記のどのファイルを、OCR変換済ファイルに変換するのですか? キャノンのScanSnap iX1500を購入して、教科書や問題集をスキャンして、iPadなどで利用したいと思っているのです。 このスキャナーは、変換されたファイルがいきなりPDFやJPEGファイルになっているようですが…。それをOCR変換するには如何すれば良いのでしょうか? 初心者ですので、知っておいたら良い関連事項も、ご指摘戴けるととても有り難いです。

  • アドビアクロバットのOCR機能について

    アドビアクロバット(目下,無償版)でPDFファイルを読みこんでテキストを取り出すことをやっているのですが、その機能等についてお尋ねします。いわゆるOCRのツール(?)なのですが。 文書ファイルがワードとかTeX経由で作成されていてそれをPDFに変換されている場合、テキスト部をマウスでドラッグすると反転してコピーと貼り付けでテキストの取り出しができます。これはOCRの機能なのでしょうか。 一方でコピー機でドキュメントを読み込んでPDFにした場合、上記のような機能にならないようです。ドキュメントがやや斜めになっているとかだからそれができないのでしょうか。それとも自分のアクロバットにOCR機能がないからでしょうか(つまり前段のテキスト取り出しはOCRではないということ?) アドビのアクロバットはフリーのものでもOCR機能はあり、ということでしょうか。それとも有償版でないとダメということでしょうか。 よろしくお願いします。

  • スキャナを使わずにPDFファイルの文字認識はできないですか?

    PDFファイルで画像として認識された文字を、文字として認識するには、「読んでココ」のようなOCRソフトを使ってスキャナで認識させればいいということは知っています。 しかしスキャナが壊れてしまったため、上記のような方法ができません。パソコンの中にある画像として認識しているPDFファイルを何らかのソフトを使って、文字認識できないでしょうか? フリーウェアであれば言うことないですが、2,3万円なら買おうと思っています。スキャナはA3読込可能なものを買おうと思っていますが、高いのでもうしばらく待ちたいと考えています。 どうかよろしくお願いします。

  • pdfを作成したい(スキャナ&Office)

    職場で、以下のような条件でpdfを作成するソフトを探しています。 今までAcrobat6.0を使っていたのですが、アップグレードに際し、 できるだけ安い(願わくばフリー)ソフトに切り替えたいと思います。 必須条件 ・スキャナからPDFに変換する ・Excel,Word,PowerpointからPDFに変換する (OFFICEのバージョンは2000) できれば欲しい機能 ・pdf文面の編集機能(テキスト、スタンプ、トリミングなど) ・OCR機能 上記の条件(必須だけでもいいです)を備えていて、 できるだけ安いソフトをご存知の方がいらしたら、 ご紹介ください。 15ライセンスほど必要です。 よろしくお願いいたします。

専門家に質問してみよう