• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:資格試験用の教科書をOCR付きPDFにして検索したい)

資格試験用教科書のOCR付きPDF化・検索について

TammyG3の回答

  • ベストアンサー
  • TammyG3
  • ベストアンサー率30% (34/111)
回答No.1

1日たっても、他の人の回答が無いので… PFU(FUJITSU)のScan Snap S300を1年半ほど使っています。    良い点:小型、安い(今なら、2万円以下)    悪い点:テキスト化に時間がかかること        ちなみに、>OCR付きPDF ではありません。        透明テキスト付きPDF といいます。    紙焼き写真を数千枚JPEG化し、書籍を何冊かPDF化しました。 書籍の場合は、10枚ずつスキャンします。 たまに、重送されますので、監視していて、 そのページを控えて、再スキャンをし、 失敗ページを削除します。    フリーソフト:PDFDP >電子書籍を管理できるソフト 特に必要がないのでは? adobe reader 9 で閲覧・検索ができます。  

kappasan_jp
質問者

お礼

TammyG3さん、こんOOは。回答ありがとうございます。 ScanSnap 1300か、キャノンのDR-150あたりを考えていますが、このクラスのものだとそんなに変わらないでしょうか。 また、楽²ライブラリ パーソナルみたいなソフトが必要かと思っていました。冷静に考えてみれば、何十冊か何百冊か大量なPDFファイルでもなければ不要なのでしょうね。

関連するQ&A

  • スキャンスナップでの雑誌の取り込み

    スキャンスナップS1500を使用しました。 いわゆる“電子書籍の自炊”をしてみたく、裁断をし、スキャンし始めたところです。 雑誌をパソコンへ取り込みたくて、スキャナをしたら紙が重複して取り込まれてしまいます。 おそらく雑誌の紙が薄く、つるつるしているため紙同士がくっつきやすいのではと思います。 10ページに1回くらいの割合で頻繁に起きてしまうので、とても手間がかかり、ページもバラバラになってしまい、作業を中断しました。 ドキュメントスキャナで雑誌を取り込んだことのある方、どのようにしたら重複が防げるのでしょうか? 何か方法があれば教えてください。

  • PDFファイルを検索可能型にしたい

    PDFファイルを検索可能型にしたい PDFファイルを検索可能型にしたいのです 透明テキスト付加などと言われていますが スキャナーでスキャンして作成したPDFファイルは 要するにテキスト情報が無い”絵”の状態です この状態だと ある文字が含まれるページを探すには1ページずつ開いて目だ探すしかありません しかし透明テキストが付加されているPDFファイルだと アクロバットリーダーなどの 検索機能が使えます 今時のスキャナーはPDFファイル作成時にテキスト情報を付加する機能があり これはこれで問題ないのですが その機能を持たないスキャナーでスキャンして作成したなどのPDFファイルでは 後からテキスト情報を付加してやる必要があります この機能を持ったソフトを探しているのですが なかなか見つかりません ソースネクストのものを購入しましたが あくまでもスキャナーで読み取った時に テキスト情報を付加するものであり既に出来上がっているPDFファイルには 対応しませんでした 無駄金使ってしまいました この要望にこたえられるソフトはあるのでしょうか? Docuworcusも利用していますが これもそのあたりがイマイチです・・。

  • 自分が所持している本を裁断後に、スキャナでスキャンした

    自分が所持している本を裁断後に、スキャナでスキャンした 電子データとしてPDF化した後、元の紙を別の場所(例えば、実家の倉庫等)に 保存したり、元の本を捨てることは著作権法上は合法でしょうか?

  • PDFファイルのページ制限について

    ScanSnap s1500のドキュメントスキャナーで辞書をPDF化使用として 読み込んだところ1.000ページでPDFファイルの上限ですと出てファイルを分けないと 読み込めません3.000ページぐらいの辞書ですが3ファイルに分けなくてはなりません 不便ですがPDFファイルにはそのような仕様になっているのですか 又そのファイルを後で結合で来ますでしょうか ご存じの方いらしたら教えて下さい

  • 教科書のばらしかた

    教科書を電子本にしたいのですが、表紙と見開きのページが糊付けされていて、そのままスキャナーに入れると、うまくいきません。これを剥がそうとすると、うまく剥がせなくて、困っています。 なんとかきれいに分離する方法はないでしょうか? よろしくお願いいたします。

  • OCR化したPDF文書をブログに載せたいのですが

     前略 これからブログをやろうかなと思っている、パソコン知識はあまりない者です。  さて。ここ数年来、新聞をスクラップしたものが凄い量になっておりまして・・・スキャナでとりこみ、PDF化し、XeloというフリーソフトでOCR化する・・・という作業を、ぼちぼちやっております。  で。この、OCR化したPDF文書を、ブログ上にアップ?し、検索できたなら・・・! 現在、活用しようもない紙の塊と化しているスクラップの山を、データデースとして活用できるのでは?と。  何しろ知識がロクにないもので、マヌケなことを書いてたらご容赦下さい(このサイトで「OCR PDF ブログ」で検索しても、ヒットゼロでしたしね。又、某ブログの「やり方ページ」を見てたら、使える拡張子?にPDFが含まれておりませんでしたし・・・)。  で、質問です。 1・現在、OCR化したPDF文書を扱えるブログは、ありますでしょうか 2・その他、「ソレ勘違いですよ」「もっといいやり方アリ!」等ありましたら、アドバイスお願いいたします・・・実は、「スキャン~OCR化した文書をファイル名つけて保存」に、5件で1時間かかっています。              どうぞ宜しくお願いいたします。草々  

  • PDFを1つにまとめたいのですが

    スキャナについてきた「読んdeココ(簡易版)」を持っています。 書類をスキャンしてワードにすると、認識がだめなのかほとんどすべて手を入れないと使い物になりません。 そこでスキャン後アクロバットにするとキレイにできるのですが、1枚1枚ばらばらのPDFになってしまいます。 どうしたら、複数のPDFを1つのPDFにできるのでしょうか? 1ページ目2ページ目・・・みたいな感じで1つの資料にしたいのです。 やり方をおしえてください。

  • OCRとページ番号編集ができるPDF編集ソフト

    スキャンした論文を使いやすくするため、PDF編集ソフトを購入しようと考えています。以前はスキャナについてきたAcrobat(9か10)を使っていたのですが、パソコンを8.1に買い替えて同じCDを使ってインストールしようとしましたができませんでした。 Acrobat Xを考えていたのですが、値段が手頃なJust PDF3(編集か高度編集版)も気になっています。どちらがいいでしょうか? 他におすすめはありますか? また、シンプルパッケージ版Acrobatというのが安いのですが、これはスキャナについてくるのと同じものでしょうか。 注釈や書き込みは無料版Foxit Readerで行っているので重視しません。 ソフトでやりたいことは以下の通りです。Just PDFの機能比較(http://www.justsystems.com/jp/products/justpdf/othercompany.html)を見てみましたが、一部の機能は掲載がありませんでした。含まれていないのでしょうか? ・OCR認識  英文中心ですが日本語もできると嬉しいです。  Just PDFだとOCR認識したテキストを簡単に直せるのでしょうか?  Acrobatについていたクリアスキャン(フォントをきれいなものに置き換える)をよく使っていました。 ・ページ番号を編集  25ページから始める、ページ番号を飛ばす(3の次のページを4ではなく5にするなど) ・スキャンしたPDFをきれいにする  歪み修正やノイズ軽減をしたいです。

  • スキャナーのOCR機能

    キャノン家庭用複合機のプリンタのスキャナー機能を使い, テキストをPDFにてスキャンしたのですが、取り込んだ透明つきPDFの 文字ばけてしまってます。 試しに,そのPDFを1枚だけ紙で出力し、その紙を再度スキャンすると 今度は文字認識してます。 また,OCRを複合機付属のものではなく、読取革命liteでお試ししましたが 結果は同じで,テキストからでは認識せず。 紙でプリント出力のものだけ認識するようです。 (オリジナルは,無地ですが)背景色の濃淡,微妙なオリジナルフォントからのずれ,紙の厚さとか 条件が違うと思いますが、何かコツのようなものがありますでしょうか。 テキストを試しに1枚破り、実験するという手はありますが 破りたくなく、どうしものかと相談させて頂きました。 宜しくお願いいたします

  • 瞬間PDF:OCR(8,000円)アンテナハウス

    お願いします。 「瞬間PDF:OCR」(8,000円)アンテナハウス この製品の広告には、「紙原稿をスキャンしてOffice文書にOCR変換」とあります。 このソフトの用途が分かりません。 「PCに接続したスキャナーでワープロ印刷の文字を読み込み、それをWordのファイルに変換する」という理解でいいでしょうか。 もしそうだとしても、スキャナーで読み込む精度には限界があり、必ずミスが発生すると予想しますが、それは私の考えすぎでしょうか。 どうぞお教え下さい。お願いします。