紙媒体を電子データ化する方法とおすすめソフト

このQ&Aのポイント
  • 紙媒体を電子データ化する方法は、スキャンしてPDFに変換し、それをエクセルやワードなどの電子ファイルに変換するという流れです。
  • しかし、安価なソフトだと誤字や表のレイアウトがおかしくなることがあります。
  • おすすめのソフトとして、Panasonicの「読取革命Ver.14」がありますが、他のソフトと比較することをおすすめします。
回答を見る
  • ベストアンサー

紙媒体(PDF)を電子データ化する良い方法は?

会社で、高校や大学の成績表を見て、点数を計算したりする作業を行っています。 紙媒体で提出された成績表を、エクセルに変換して関数で処理できたらなと思っています。 まずはスキャンしてPDFにして、それをエクセルやワードなどの電子ファイルにするという流れになると思うのですが、以前、使っていた2000円ぐらいのソフトだと誤字がけっこう多かったし、表のレイアウトがおかしくなってしまいました。 Adobeのアクロバットプロフェッショナルも見てみたのですが、そもそも電子データ化といっても文字のみしか変換できないし、その精度もとてつもなくひどいものでした。 何かお勧めのソフトや方法はないでしょうか? ご紹介願います。 検索して出てきた「読取革命Ver.14 」 http://panasonic.co.jp/snc/pstc/products/yomikaku/ というソフトも良さそうなのですが、他のソフト等と比較することはできないので、どなたかにアドバイスしていただけると幸いです。

質問者が選んだベストアンサー

  • ベストアンサー
  • phobos
  • ベストアンサー率49% (515/1032)
回答No.5

ANo.3です。 > 読取革命、e-typist、読んde!!とどっちが正確に読み取れるとかありますか? 「日本語OCR 比較」などのキーワードでネット検索するといろいろ情報が得られるのでお試し下さい。 その一例ですが、 「モノマニア/文系研究者電化製品批評ブログ」より「現行の日本語OCRソフト比較」(2010/5)  http://monomania.sblo.jp/article/38425565.html で実際に読み取り精度の比較検証をしています。 同ブログによれば、 ・読取革命(Ver14)……認識文字種約4000字、辞書約18万語 ・読んde!!ココ(Ver13)……認識文字種約3600字、辞書約18万語、英語6万語 ・e.Typist(Ver12)……認識文字種約6700字、辞書約150万語、英語6万語 で、性能的にはe.Typistが優れていますが、普通のユーザが普通に会議資料などの横書き原稿を読み取る際には、ほとんど性能差はないとの事です。 私の考えでは、多分それぞれのソフトで読み取り精度にはあまり差がないと思いますが、使い勝手や得意不得意分野の違いはあると思います。 ですので、いずれにせよ、まずはそれぞれ体験版を実際に使ってみて、質問者さんの用途に一番合った物や使い勝手が良いものを選ぶのが良いのではないでしょうか。

schuler
質問者

お礼

遅くなりましたが、ありがとうございます。 大変参考になりました。 しかし、読み取り革命でも私の希望とはほど遠いものでした。 成績表のような細かいものや、コピーガードのついた紙は無理でした。

その他の回答 (4)

  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.4

後はEPSON(旧ai-soft)の読んde!!ココ http://www.epson.jp/download/dms/dl_yondekoko.htm 読取革命、e-typist、読んde!!といったところが一般向けと思います。 3つとも、excelへの変換が可能なはず 大量に行う場合は、ドキュメントスキャナの販売元(キヤノン、パナ、日立などのソリューションビジネスを提供しているところ)に相談することになると思います。 まさか、毎年1000人分を入力しているとかはないですよね? 古い記事ですけど、日経パソコンの記事が参考になると思います。 http://pc.nikkeibp.co.jp/article/NPC/20070130/260012/

schuler
質問者

お礼

ありがとうございます。 いろいろあるのですね。 どれが読み取りの制度が高いとかありますか?

  • phobos
  • ベストアンサー率49% (515/1032)
回答No.3

メディアドライブ社のOCRソフト「e.Typist」をVer.8からVer.11まで使ってきていますが、紙媒体の表をスキャンしてそのままエクセルのワークシートに変換するのは今時のOCRとして当然の標準機能ですね。 「e.Typist」に限らずOCRでの文字認識精度は原稿の状態次第としか言えませんが、バージョンが上がるに従って精度が上がってきたのは確かです。 一概には言えませんが、経験上例えばプリンタ出力生原稿の12ポイント漢字ならほぼ間違いなく認識できます。 ただし拡大コピーした原稿やコピーを重ねて文字がつぶれた原稿では当然認識率は落ちてきます。 なお数字やアルファベットは漢字より認識率が高いです。 同社のホームページ  http://mediadrive.jp/products/et/index.html から最新版(Ver.14)を5日間使える体験版が無料でダウンロード出来るようなので試用して比較してみたらいかがでしょう。

schuler
質問者

お礼

ありがとうございます。 精度が上がってきているのですね。 読取革命、e-typist、読んde!!とどっちが正確に読み取れるとかありますか?

  • chieffish
  • ベストアンサー率44% (1149/2554)
回答No.2

そもそも、表をスキャンしてそのままエクセルに、というのが無理な話です。 OCRテキストをブロック選択(矩形選択)等して利用するしか・・・

schuler
質問者

お礼

ありがとうございます。 上で回答してくださった方が、基本だとおっしゃってますが・・ 電気屋で少し見たのですが、そういうこともできそうでしたよ。

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1

体験ができないので買ってみないと効果は確認できないですが、「リッチテキストpdf」がありますよ。

schuler
質問者

お礼

ありがとうございます。 他の変換ソフトと比べてどっちが正確に再現できるんでしょうね・・

関連するQ&A

  • できるだけ安上がりでスキャナーとOCRソフトを使って紙媒体からテキストデータを取得したい

    【したいこと】 分厚い本(電話帳くらいの頁数です)に記載された情報をExcelシートに効率的に取り込んで管理したいです。読み取り対象の印刷物(本)はモノクロで、文字情報と枠線のみで構成されています。(画像も複雑な段組もありません。) 【やり方】 スキャナーと(できれば製品に付属版か無料版の)OCRソフトを活用して、約2000頁の印字された情報を、直接Excel出力して取得したいです。 【ポイント】 お金があまりありません。 ただ、調べてみるとA4サイズ対応のスキャナーで1万数千円~くらいのものも市販されているようです。簡易版のOCRソフトも付いているようです。 【教えてください】 1)投資金額1万円台で、上記のしたいことは実現できるでしょうか? 2)1枚の紙媒体をスキャナで読み込んで、その後Excel出力するのにだいたい何秒(何分?)くらいかかりますででしょうか? (※ご認識文字の手修正など、加工作業は一切時間に含めない場合の、単純な読取時間+Excel変換時間) 【補足】 今のところ、文字認識の精度がいいと聞いた「読取革命Lite(Canonのスキャナに同梱)」か「e.Typist(体験版)」をOCRソフトとして考えています。 上記の1)、2)を教えてください。 どうぞよろしくお願いいたします!

  • PDFからExcel

    過去にも同じような質問がありますが、質問させて下さい。 PDFや画像からExcelに変換したいのですが、 様々なソフトがあり、全部試したくても、サイフに余裕がありません。 できるだけ高精度というか、フォントサイズやタイプ、レイアウトを再現してくれるソフトを探しています。 今気になっているのが 「戻す!PDF to 表計算」 「表OCR for Excel」 「e.typist」 の3つですが、他に良いソフトがあれば教えていただけると助かります。 「いきなりPDFシリーズ」は視野に入れていません。 宜しくお願いいたします。

  • 情報誌(紙)をPDF以外でウエブサイトに載せたい

    当社の発行する情報誌をウエブサイトにアップしたいと思っています。 本誌(紙)とPDF形式のファイルならばあるのですが、PDFですとどうしても敬遠されてしまうので、それ以外の方法で公開したいと思っています。 できるだけ低予算で、時間をかけないで作業したいのですが、どんな方法があるでしょうか。 ちなみにOCRソフト(読取革命)やアクロバット7.0でHTMLに変換を試みたのですが、時間がかかる上、不正確で使えません。 全てHTMLで手入力していく方法は確実ですが、時間がかかりそうですし、これから毎月のことを思うと気が遠くなります。 同じような経験をされた方、何でもかまいませんのでコメントお願いします。

  • 紙の電子化

    エクセルで作った表を印刷した紙があって、 それをエクセル(またはワード)文書に変換したいです。 「読んでココ」というスキャンソフトと、 AdobeACROBATのソフトはPCにインストールしてあります。 「読んでココ」でスキャンした画像を pdf化して、それをwordに変換しよう!!と思いついたのですが、 wordにすると、画像が貼り付けられてる状態になります。 画像ではなく、編集できる(文字を触れる)状態に したいのです。 へたな説明でスミマセン。 方法をご存じの方、どうか教えて下さい。

  • OCRソフトについて。

    PDFファイルの表等をエクセルに変換、文書をワード等に変換したいのですが、 体験版等で試しても文字化けしてしまいます。 設定方法が的確でないのか?、あるいは おすすめのソフトあれば教えてください。試したソフトは、 読んでここ、読みとり革命Ver12、イータイピストver12 です。 よろしくお願いします。

  • エクセルをPDFにすると真っ黒

    初歩的な質問なのでしょうが、お願いします。 アクロバット6.0をインストールしていますが エクセルで作った表をツールバーのPDFへの変換 からPDFにすると、データの入った領域が 真っ黒に塗りつぶされたみたいになってしまいます。 どうすれば正常に変換できるのでしょうか?

  • アドベのPDFのデータをエクセルに変換したい。

    アドベのPDFで作られているデータをエクセルに変換して使いたいのです。元のデータは、表の形式になっており、セル内の文字は、データとしてPDFには組み込まれています。ですから、コピー&ペーストで、データとして認識させて、一部をエクセルに移すことは可能です。しかし、表全体をエクセルに移そうとすると、行や列が整列せず、ぐちゃぐちゃなデータになってしまいます。せめて、1列ずつでも認識できれば作業は楽になるのですが、1行ずつは可能でも、1列ずつは、私には無理でした。 このような場合、アドベのアクロバット7などの編集できるものを使うと、これらのデータを編集しなおして、エクセルに変換したりできますか?たとえば、表のうち1列を空白セルにしたり、特定の文字に入れ替えたりできますか?もしできれば、試行錯誤して、エクセルの表に直すことは可能だと思うのです。

  • スキャナで読み込んだデータをエクセルデータに変換したい

    ペーパーからスキャナで取り込んだデータですが、表形式になっているので、エクセルへ変換できないか試しています。先日『いきなりPDF to DATA』というソフトを購入しましたが、ペーパーからでは図形としか認識せず、エクセルへの出力が出来ません。ペーパーデータをエクセルへ変換する方法がございましたら、ご教授願います。当方、ACROBATといきなりPDF to DATAのソフトは所有しています。

  • PDFファイルで

    AcrobatのPDFファイルからExcel等のファイルに変換出来るソフトというものはないのでしょうか? 知識が少なくお教えていただけたら幸いです。 よろしくお願いします。

  • PDF変換するとgif画像の背景が・・・

    ただ今、エクセルや一太郎で作成した図入りの表を、AcrobatやフリーソフトでPDFに変換しました。 すると、貼り付けてあるgif画像の背景(元のエクセルや一太郎では透明になっている)が、真っ黒になってしまいます。 これを透明のままPDF化することはできないのでしょうか。 使用PCはWinXPsp2、Acrobatは7.0standard、OfficeはXP、一太郎は12です。 よろしくお願いいたします。

専門家に質問してみよう