• ベストアンサー

PDFファイルをWordかExcelに変換したい。

PDFファイル中の文字が、なぜか少しにじんで、文字として読めるのですが、テキストとして認識しません。このような状態のPDFファイルをWordに変換するOCRソフトを教えて下さい。できたらフリーがいいですが、なければシェアウェアでもいいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • axel_eye
  • ベストアンサー率64% (145/226)
回答No.1

PDFからWordなどに直接変換するソフトは多分、フリーやシェアウェアでは無いと思われます。 また、OCRのソフトですが、PDFをそのままOCRするには、Adobe社のAcrobatを使用する方法か専用のOCRソフトを購入する必要があると思います。 専用のOCRソフトでは、『読んでココ』と言うソフトが比較的有名かと思います。 http://ai2you.com/ocr/ フリーで行いたいのでしたら次の方法が提案できます。 1.PDFをJPG画像に変換する。また文字の輪郭をはっきりさせる。PDFに書き戻す(ChainLP) 2.1で作成した文字輪郭をはっきりさせたJPG画像のOCRをかける(i2OCR:Webサービスです) 3.OCRの結果と1で書き戻したPDFを結合する(PrimoPDF) それぞれソフト及びウェブサービスはサイトは以下にいあります。 ChainLP http://no722.cocolog-nifty.com/blog/chainlp/ i2OCR http://www.sciweavers.org/free-online-ocr PrimoPDF http://www.primopdf.com/index.aspx しかし、i2OCRの文字認識率は非常に低いです。 もし、質問者様がにじんだ文字を少し読みやすくしたいと言うだけでしたらChainLPを使われるとにじみは少なくなると思います。 さらに、テキストとして認識される部分までを目的とするのでしたら期待される結果は得られにくいと思います。i2OCRの文字認識率が非常に低いためです。 上記のAcrobatや読んでココなどのOCRを持ちいれば、テキストとしては認識するようになりますが、文字のにじみは直らないと思います。また、これらのOCR専用ソフトであっても文字認識率は100%にはなりません。なぜなら、OCRそのものの機能が画像を解析して、解析結果近い文字をあてはめる作業を行うからです。解析アルゴリズムは各社様々ですが、画像->文字へ変換するための完璧なアルゴリズムは現状存在しません。にじんでいる画像PDFなら尚更認識率は下がる事と思います。 Acrobatも読んでココも体験版があると思いますので、実際使われてみると認識率がわかると思います。 OCRが完璧で無い以上、仮にWordなどを生成しても完璧なWordが出来ないと言う事です。 綺麗に読みたいか、テキストとして認識したいかのどちらかに分けられてソフトを選択されるといいかと思います。

その他の回答 (1)

  • a0832669
  • ベストアンサー率30% (45/148)
回答No.2

出来るかどうかは不明ですが pdftoexcel もしくは pdftoword と検索してみてください。 アメリカのサイトですがfreeで変換してもらえます。 一部、出来ないpdfもあるようですが、便利なサイトなので使用してます。 お試しください。

yamadatarou1346
質問者

お礼

質問に答えて頂いてありがとうございました。 しかし、このサイトは使用してみましたがもりでした。

関連するQ&A

  • PDFファイルから Word 2003 のファイルへの変換の仕方を教え

    PDFファイルから Word 2003 のファイルへの変換の仕方を教えてください。 Adobe Acrobat 7.0 Standard で読み込んだPDFファイルを「OCRを使用してテキストとして認識」させた後、「名前を付けて保存」「Word文書*.doc」を選択してやってみたのですが、文字化けしたり、一部が縦書きになるなど、もうむちゃくちゃな文書になってしまいます。 どうすれば、うまく変換できるのでしょうか。教えてください。 また、Adobe Acrobat 7.0 Standard で開いたPDFファイルを編集することはできないのでしょうか。 合わせてそれも教えてください。お願いします。

  • WordからPDF変換について

    はじめまして。 WordからPDFへの変換をフリーソフトの「PrimoPDF」を使い行っていました。 しかし、PDFへ変換すると、Wordのテキストボックスを使って書かれた文字がPDFにすると字色が白くなってしまいます。 一部のテキストボックスで書かれた文字は、正常に黒色で変換されているのですが、8割、9割白色になってしまっています。 以前は、このような問題もなく正常に変換ができていました。 なので、変換ソフトの問題かと思い、他のフリーソフト「クセロPDF」を使ってみたのですが、全く同じ様に出力されてしまいました。 これは、変換ソフトの問題ではなく、Wordの設定がおかしいのでしょうか? いろいろ設定を見たのですが、おかしなところがわからないでいます。 検索でも調べてみたのですが、解決方法が見つからないでいます。 なので、ここに質問させていただきました。 わかる方が居ましたら、宜しくお願いいたします。

  • PDFファイルをテキストに変換というかテキスト抽出を出来るようなフリー

    PDFファイルをテキストに変換というかテキスト抽出を出来るようなフリーソフトが もし存在していましたら教えていただけませんでしょうか? やはりシェアウエアのみしか存在していませんでしょうか? PDFの書類の修正をしなくてはならなくて、、、そのままテキスト抽出出来たら 修正が楽なのですが、、、、シェアウエアはあると思うのですが、会社ですぐには ソフトを買ってもらえないので、何か良い方法はないか?と困っております。 段階を経て出来るような裏技とかでもあれば教えていただけませんでしょうか? どうぞ宜しくお願い致します。

    • ベストアンサー
    • Mac
  • PDFファイルをエクセルに変換する

    PDFファイルをエクセルに変換する OCRソフトを探しています。 認識率の高いものを希望しています。 おすすめのソフトを教えていただけると嬉しいです。

  • PDFをワードに変換

    Microsoft ワードの「ファイル」の「開く」でPDFのファイルを指定すると、そのPDFの内容がワードファイルとして読み込まれます。  PDFに図面が混じっている場合や余白部分にページ番号等が記載されている場合に意味不明なワード文章となることは仕方ないと思います。  しかしPDFが文章だけの場合でも、読み取ったワード文章にワードのフォントと画像(文字表す画像)とが混在する場合があります。  もう少し優れたPDF→ワード変換ソフトは開発されていないのでしょうか。元のPDFデータを一度濃く印字してOCRで読み直してから、変換した方が正確に変換される場合もあるでしょうか。

  • PDFからExcelへの変換

    PDFファイルをExcel(出来れば、Wordにも)に変換したいのですが、変換効率・精度が良いソフトは何があるでしょうか? フリーソフト、シェアソフト、市販ソフトでお奨めのモノがあればアドバイスお願いします。 予算1万円です。

  • PDF⇒Word,Excel変換について

    Word,Excel⇒PDFへの変換ソフトは沢山あるのですが、 表題通り PDFファイル⇒Word,Excelに変換できるフリーソフトウェアはありますでしょうか?

  • PDFファイルをwordに変換する

    PDFファイルをWORDへ変換するフリーソフトはどこで手に入りますか?

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • ワードのファイルをPDFに変換するには?

    ちょっと急いでます。 ワードのファイルをPDFに変換が出来ると聞いたのですがどのようにすればいいのでしょうか?  そのようはフリーソフトはありますか? 短い文になってしまいましたがよろしくお願いします。