- ベストアンサー
書籍の電子化の方法とOCRの利点について
- 書籍を電子化する方法について調べています。現在は裁断し、文書スキャナで取り込んでフォルダに分類していますが、OCRソフトの利点について知りたいです。
- 購入した編集ソフト(PDF-XChange4 Pro)を使用して書籍の電子化を行っていますが、すでにOCRを使用しているのか不明です。OCRの意味や利点について教えてください。
- 書籍の電子化について調べていると、OCRソフトを使用することが推奨されています。OCRの利点や使い方について詳しく教えてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
OCRとはPDFデータにある文書を、テキスト文書のように認識させることです。 そうしておくと、PDF内の単語や語句を、txtやwordファイルのように検索できます。 調べ物に必要な本を電子化した場合、探している語句を検索すれば一発で探せるので便利です。 OCR化していないと、PDFデータ基本、画像データのように扱われ、文章検索ができません。 文字検索が出来るPDFになっていればOCR化されています。 検索できなければOCR化されていないということです。 ただOCR昨日自体が完璧に認識してくれるわけではないので 全文が正しく検索できるとは限りません。
その他の回答 (2)
- SPROCKETER
- ベストアンサー率26% (2128/8000)
OCRというのはoptical character recognition(光学文字認識)の略称で、活字に印刷された文字をテキストデータに変換する技術の事です。 OCRソフトを使うと、活字印刷された文章をテキストデータに変換出来るので、データ量が大幅に減り、ワープロソフトなどを使って編集出来るようになります。 もっとも、活字以外の文章ではOCRは使いものになりません。手書き文字では認識出来ない例が多いからです。 OCRを使って読み込めるのは活字の印字品質が良い場合だけで、そうでない場合は誤認識が多くなって失敗する例が多いようです。 大量の情報を保存出来るHDD、BD、USBメモリーが普及した現在では、画像データ(PDF)として読み込む方が失敗が少ないですね。編集出来ませんし、データ量も増えますが、一般的なように思います。 OCRによる書籍の電子化は、単行本のように絵や写真が入っていない文章だけの出版物の場合に有効ですが、画像のまま保存するPDFの方が多いのではないでしょうか。
お礼
OCRはテキストデータに変換され、データ量が減るという利点もあったのですね。 でもおっしゃるように、HDDも大容量ですしこのままでいいかと思えてきました。 続けて回答いただき、知識が増えました。 ありがとうございました。
- maiko0318
- ベストアンサー率21% (1483/6969)
OCRは文字読み取りソフトです。 おっしゃっているようにあとで検索ができるようになります。 原本は捨てちゃうわけですから、バックアップはきっちり取って なくなってしまわないようにしましょう。w
お礼
さっそくにありがとうございます。 検索は、あまり重視していないのでこのままでいいように思えてきました。 バックアップ必要ですね。一段落したらと思っていたのですが、怖くなってきたのでちょくちょくとるようにします。 ありがとうございました。
お礼
今やってみましたら、文字検索できました。 OCR化されていたのですね。 また何かしないといけないかと思っていたので、気が楽になりました。 ありがとうございました。