• ベストアンサー

PDFの変換ソフトについて

会社の資料を整理したいのですがペーパーでなくデータ(テキストファイル)で保存したいと思っています。資料をスキャンしPDF化するのはすぐですが画像データはPCの容量を食うのでPDFファイルから変換ソフトを使ってテキスト化できればと思っています。フリーソフトでFirstPDFというものを使ってみましたが、文字化けが多くうまく変換できません。よいソフトを紹介してください。

質問者が選んだベストアンサー

  • ベストアンサー
  • mitarashi
  • ベストアンサー率59% (574/965)
回答No.1

無理だと思います。 2~3年前の事例ですが、市販の数万円のOCRソフトを使っても、和文に比べて簡単そうな英文でさえ、字体によっては1とlとか、mとrn等の認識エラーが多発して手直しを余儀なくされました。もし、手の届く価格で人間の様に前後の文脈まで認識して判別してくれるソフトが開発されても、100%完全はあり得ないと思います。多量の文書を確認・修正するのは不可能でしょう。 現在のご方針ですと、挫折する事請け合いですので、方針を転換して容量の大きな記憶媒体を準備される方が賢明です。どんな文書が対象か存じませんが、白黒二値なら、解像度を結構上げてもさほど巨大なファイルにはなりません。また、最近のドキュメントスキャナーのカラー高圧縮モードは、色調の差が大きな文字が判別できるレベルの画質ですが、ファイルは相当小さくなります。 また、最近のスキャナーは、スキャンと同時にOCRして、pdfにテキスト情報を付与してくれますので、検索の助けにはなります。(精度は上述の通りなので、検索してヒットしなくても存在しないと思ってはいけませんが) そんな事は無いという情報がありましたら、当方も教えて欲しいです。

その他の回答 (4)

  • mitarashi
  • ベストアンサー率59% (574/965)
回答No.5

#1です。 奇しくも当方が使用しているのは、#2さんお勧めのソフトで、ドキュメントスキャナーのおまけをアップグレードしたものです。既に最新版ではないと思いますが。 ちょっと言葉足らずのところがありましたので、補足させていただきます。 >最近のドキュメントスキャナーのカラー高圧縮モードは、色調の差が大きな文字が判別できるレベルの画質ですが、 →色調の差が大きな文字の色の違いが判別できるレベルの画質ですが 以上、ご参考まで。

opera1971
質問者

お礼

ありがとうございました。参考にします。

  • DOUGLAS_
  • ベストアンサー率74% (397/534)
回答No.4

>会社の資料を整理したいのですがペーパーでなくデータ(テキストファイル)で保存したい >文字化けが多くうまく変換できません。  「文字化けが多」いかどうかは分かりませんが、下記をお試しください。 1)PDFを、拡張子「tif、tiff」(Tagged Image File Format)で画像化します。 2)画像化された「tif」ファイルを Microsoft Office Document Imaging で開きます。 3)予め、[ツール(T)] - [オプション(O)] - [OCR] タブ で [OCR 言語(L):] の下の選択肢から「日本語」を選択しておきます。 4)[ツール(T)] - [OCR を使用してテキストを認識(R)...] し、[ツール(T)] - [テキスト を Word に送る(T)...] します。 5)ワードで、拡張子「txt」で保存します。

opera1971
質問者

お礼

ありがとうございました。

  • kyuhan
  • ベストアンサー率23% (43/181)
回答No.3

プリンターのメーカーは何処でしょうか?キャノンでしたら?PDFからテキストファイルに変換出来ます! またAdobe Reader でもPDFファイルをテキストファイルに変換出来ますが?

参考URL:
http://get.adobe.com/jp/reader/
opera1971
質問者

お礼

ありがとうございました。参考にします。

  • bakamr
  • ベストアンサー率32% (149/463)
回答No.2

有料ですが、e.typist がお勧めです。 http://mediadrive.jp/products/et/

opera1971
質問者

お礼

ありがとうございました。参考にします。

関連するQ&A

  • PDFファイルを結合するソフト

    会社でのことですが、FAXで送られてくる資料や、データでなく紙でもらう資料をスキャンして保存しています。 保存形式はフォトショップでPDFにして保存しているのですが、例えば5ページの資料であれば、スキャンすると5個のPDFファイルができてしまい、一度に5ページの資料として見れません。 一般的にみかけるPDF形式の資料(家電のマニュアル等でよくあるものです)はページになって一度に見れるようになっていますが、スキャンしたデータをそのようなページ形式のPDFファイルにすることはできますか? 知人に相談したらアクロバットを買えといわれましたが、ちょっと高いです・・・ フリーでできればそれにこしたことはないですが、お安くできる方法、もしくはソフトがあれば教えてください。 お願いいたします。

  • pdf変換ソフト

    pdfファイルをテキストに変換したいのですが、わかりやすいフリーソフトがあれば教えてください。

  • 普通のPDFファイルを透明テキスト付きPDFに変換するソフト

    普通のPDFファイルを透明テキスト付きPDFに変換するソフトを探しています。 できれば簡単に変換できてフリーソフトが良いのですが無ければ市販品でもかまいません(できるだけ簡単にできるものが良いです) 今は会社のコピー機(コニカ製)についているスキャナで見積書等をスキャンしていますが検索もできると作業効率がグーンとUPするので探しています。 よろしくお願いします。

  • image only のpdfをテキスト変換

    100ページほどある会社のマニュアル(pdf)をデータ化することになり 困っています。 image only のpdfファイルを、テキストデータに変換したいのですが、 フリーソフトもしくは体験版のダウンロードで済ませることは可能でしょうか? acrobat paper capture をダウンロードするとテキストデータに変換できる ことまではわかったのですが、これはacrobat reader を購入していなければ 使えないでしょうか。 パソコンにとても疎いので、細かく教えていただけると助かります。 使っているパソコンのOSはXPです。 よろしくお願いいたします。

  • PDFからエクセルへの変換ソフトを教えて下さい。

    PDFからエクセルへの変換ソフトを教えて下さい。 ファイル内容が表のPDFファイルを、エクセルファイルに変換したいのですが、 いろんな変換ソフトを試してみましたが、レイアウトズレや文字化けが起きます。 元の表のレイアウトズレや文字化けが起きない、何かオススメのPDFからエクセルへの変換ソフトがあれば教えて下さい。 OSはVistaです。

  • PDFをテキストデータに直ちに変換できなくする方法

    ワードで入力した文書をPDFに変換した場合、コピペまたはPDF→ワードへの変換により直ちにテキストデータに変換できますよね。 ワードで入力した文書をPDFに変換した後に、その「PDFから、ワードなどのテキストデータに直ちに変換できないようにする方法」があれば、お教え下さい。 なお、いったん紙にプリントアウトしてからスキャンしてPDFにする方法も、「PDFから、ワードなどのテキストデータに直ちに変換できないようにする方法」 の一つです。 この場合、「スキャンしたPDF」は、OCRソフトによりテキストデータにできますが、OCRソフトを介すること、又はグーグルドキユメントなどのwebサービスを介することが必要なので、「直ちに変換できる」とは言えません。 このような、いったん紙にしてスキャンしてPDFにするという方法ではない、それ以外の、「PDFを、ワードなどのテキストデータに直ちに変換できないようにする方法」の質問です。

  • pdf変換

    近々、A4数枚の紙資料をpdf変換で送りたいと思っています。 フリーソフトをダウンロードすればよいのかなと思いました。 使用しているPCはエイサーのL3600、OSはビスタです。 そこで質問いたします。 (1)PCは確か32ビット。フリーソフト紹介のページには64ビット対応のボタンがありましたので、ダウンロードは32ビットPCでは無理なのでしょうか? (2)ダウンロードも可能な場合、紙資料は一度カメラ撮影してPC保存したものを、pdfに変換し、 それをpdfデータとして閲覧あるいは印刷するという手順になるのでしょうか? (3)pdfデータを受信する側も私同様PC関係初心者でもあり、受信してもすぐに閲覧できず戸惑う可能性も考えると、こちらが送信する際に何か付加するメッセージなどがあれば知りたく、アドバイスをお願いします。 *PCを起動させると、勝手にPDFのインストール画面がたびたび現れます。 無料閲覧ソフトでアドビリーダーとか、Xとかアドビフラッシュとか、アドビエアとか何だか沢山種類があって、どれを使えばよいのかよくわかりません。

  • PDFのOCR変換

    お世話になります。 現在やさしくPDF OCR v2.0を使用しているのですが、昨日スキャナでデータをエクセルに取り込んで保存形式をPDFにして、その保存したものを上記ソフトでテキストに変換しようとしたのですがファイルを読み込んでくれません。 PDFでも変換可能なものもあるのでなぜこの場合ができないのかわかりません。(PDFのバージョンやエクセルでのPDFは何かAcrobatと違う?) 使用OSはWinVistaHomeです。 どうか宜しくお願いします。

  • お薦めのPDF化(変換?)フリーソフトを!

    ・初歩的な質問で恐縮です。 ワードなりエクセルのファイルをPDFファイルにコピーし、それを添付したメールを送りたいと画策したのですが、PDF化(変換?)ソフトが必要だと言われてしまいました。しかし、沢山ありすぎてどれを選んでいいのか判断しかねています。 お薦めのソフト(できれば大容量のフリーソフト)をお紹介戴けませんでしょうか。よろしくお願いします。OSはWin.XPです。 ちなみに、これまで苦労して選んだソフトは、残念ながら全てコピーできないものばかりでした。

  • PDFをエクセルへ変換

    緊急ヘルプです。 会社の書類なのですが、 紙ベースの書類をPDFにしたデータをエクセルに変換したいのですが、 会社の同僚に依頼したら文字化け、位置ズレを起こしました。 使ったのは、わかりませんが、何かのフリーソフトです。 紙ベースをPDF化したデータをうまくエクセルに変換出来るフリーソフトを知っている方、すいませんがどんなフリーソフトがあるか教えて下さい。

専門家に質問してみよう