• ベストアンサー

PDFから文字を抽出する方法

PDFから文字を抽出してくれるようなツール・サービスってないでしょうか? 出来れば無料がありがたいんですが、知っていたらおしえてください!

質問者が選んだベストアンサー

  • ベストアンサー
  • l1798y53i
  • ベストアンサー率50% (27/53)
回答No.1

http://www.atmarkit.co.jp/flinux/rensai/linuxtips/745textfpdf.html Windows/DOS版もあります。 ※画像データとして入っている文字はこの方法では取れませんが。。参考までに。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • U-Seven
  • ベストアンサー率56% (557/986)
回答No.2

『xdoc2txt』 http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html 非営利の利用(個人利用、教育関係、非営利組織での利用)の場合、フリーで使用できます。 webページには色々書いてありますが、デスクトップのアイコンにファイルをドラッグすればTXTファイルが出来上がります。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • PDF から文字を抽出してexcelに

    文字データとしてコピー可能な複数のPDFから特定の文字に続く文字30字を抽出し、エクセルにペーストして一覧を作ることを考えています。 excel VBA当たりで可能ではないかと思ったのですが、PDFファイルのコントロール方法が分かりませんでした。 wordならexcelでコントロールできるかもしれないと思い、複数のPDFを一括で複数のrtfに変換し、excel_VBAでwordでrtfを開くことが出来たのですが、その後の特定の文字に続く文字30字を抽出、エクセルにペーストする方法が分かりませんでした。 良い方法を御存知の方、教えていただけないでしょうか? 完成形はエクセルで下記のような形です。     A      B 1 ファイル名 抽出文字 2 3

  • PDFの画像を抽出

    PDFの画像を抽出したいのですが、 スナップショットツールでやった見たところ、 だいぶ画質が落ちていて、使い物になりません。 PDFの画像を抽出するソフトを探して、「Pto BMP」 と言うソフトを使ってみたのですが、どうやらそのソフトを使うには「Bto PDF」で変換したPDFファイル でないと変換できないようなので、他のソフトを 探したのですが、なかなか見つかりません。 他に良いソフトはないでしょうか。

  • PDFから文字情報を抽出し、表に落とすには。

    請求書等、フォーマットが決まっている PDFから、情報を抽出して、 一覧表(Excel等)にするようなソフトウェアはないでしょうか? (※PDFの文字情報はテキスト化されています。)

  • PDF上の文字を認識できるようにする方法

    スキャンしたPDF上の文字を、認識できるようにする方法はありますか? 文字を認識し、選択や検索ができるようしたいです。 文字認識でいないPDFから文字認識できるPDFへの変換方法です。 調べてみましたが、自分に合ったものがありませんでした。 ・GoogleDriveを使った方法→できればクラウド上にアップロードしたくない。 ・自分でコードを書いて作る方法→ヒットするのはテキスト抽出する方法(抽出をしたいわけではない) よろしくお願いいたします。

  • PDFから画像抽出

    サーバ上(Linux)で動くPDFから画像を抽出できるツールってありませんか?できれば、PHPやRubyから操作できるものがあれば最高です。だれか詳しい方がいましたら教えていただけないでしょうか。よろしくお願いします。

    • 締切済み
    • CGI
  • PDFから画像を抽出

     個人的にPDFが嫌いなので、読みやすいhtmlかdocに変換しようと思っています。  テキストは、AdobeReaderの機能を使って抽出できたのですが、画像のほうが抽出できません。  一つ一つ取り出すのはフォト何とかツールでできると聞きましたが、全ての画像要素を一括して抽出する機能は、AdobeReaderにはないでしょうか?もしくは、そういったことができるソフト(できるだけフリーで・・・。)はないでしょうか?  なお、Acrobatは所有していません。

  • 画像から文字を抽出するソフト

    画像から文字を抽出するソフトを探しています。 できればフリーでお願いします。 ひとつお聞きしたいのですが、ソースネクストの『いきなりPDF』はスキャナで取り込んだ画像から文字を抽出するみたいですが、元々あるJPEGなどから文字を抽出することは可能なのでしょうか? 回答お願いします。

  • pdfファイルから、テキストを抽出したい

    pdfファイルから、テキストを抽出したいと思っています。 テキスト選択ツールで、テキストを選択し、コピー&ペーストでも良いのですが、これだと一ページずつ細切れになってしまいます。 何とか、これを一度で、コピー&ペースト、ないし、抽出できる方法はないでしょうか?

  • PDFそのものから、テキストの抽出

    PDFそのものから、テキストの抽出は可能ですか? Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。 ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか? 逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

  • PDFファイルの文字列を抽出する方法

    環境 OS:RedhatLinux ES3 PHP:4.4.0 Apache:2.0.54 サーバーに置いてあるPDFファイルの中の文章をPHPを使って 抽出したいのですが、どのようなやり方がありますか?

    • 締切済み
    • PHP
このQ&Aのポイント
  • DCP-J988NのWifi接続に関するトラブルでお困りですか?本記事では、Wifi接続トラブルの解決方法を詳しく解説します。
  • Windows10とiOSを使用している方向けのDCP-J988NのWifi接続トラブル解決法をご紹介します。無線LANを使用している場合の対処法も解説します。
  • DCP-J988NのWifi接続トラブルはひかり回線を使用している場合でも起こることがあります。本記事では、ひかり回線を使用している方向けにトラブル解決の方法をご紹介します。
回答を見る