• 締切済み

pdfファイルのテキスト部分を書き出すことはできますか?

kazuya-iの回答

  • kazuya-i
  • ベストアンサー率21% (7/32)
回答No.1

pdf2txtというperlのスクリプトがあるみたいですね。 ざっと見てみるとフリーではそれ以外にはなさそうな 気がします。 pdf2txtで検索してみてください (オフィシャルなページ見つけられなかったので)

can
質問者

お礼

ありがとうございました。 試してみることにします。

関連するQ&A

  • pdfをテキストファイルにしたいです

    文書をスキャナで読み込み、ひでまるエディタでテキストファイルにしたのですが。 再度やってみたらやり方を忘れてしまってできません。 スキャナで読み込んだtifファイルを保存して、アクロバットリーダーで PDFにしました。 それを何かをして保存したらデスクトップに秀丸でテキストファイルになって保存できて いました。 再度やってみたら、どうやったのか、どうしても思い出せないのです。 それと、A5の本を見開きで横にしてスキャナで取り込んだので、文字が横になっているので( A4は縦に置かないと認識しないので) アクロバットリーダーで90度回転させ、保存しても、ファイルを開いたら 読み込んだままの90度回転した(文字が横になっている)ファイルになっています。 どうしたら文字が真っ直ぐ上を向いたままの状態で保存できるのでしょうか? 聞きたいことは、 1.PDFをテキストファイルにする方法 2.PDFのファイルを90度回転させたまま保存する方法です。 OSはWINXP  アクロバットリーダーはX アクロバット スタンダード7.1もあります。 よろしくお願いします。

  • 透明テキスト付きPDFファイルを作成したい

    pdMaker for ScanPaper や 読んde!!ココ 等のOCRソフトでは、スキャン後、認識した文字を透明テキストにてPDFに付加し、その情報をもとに文字情報を検索できることがわかりました。 この「透明テキスト」は、adobe Acrobat 7.0でも 作成することは出来るのでしょうか。 Acrobat 7.0評価版をダウンロードしたのですが、「透明テキスト」というような項目はないようです。 なお、Acrobat7.0の メニュー→文書→透かしと背景の追加 機能が同等の機能かとも思うのですが、よくわかりませんでした。 既存のPDF形式のデータに、検索可能な文字情報を付加する方法を教えてください。

  • PDFファイル テキストボックス編集について

    Adobe Acrobat 6.0 Standardを使用してPDFファイルを編集しています。 テキストボックスを挿入して文字を入れているのですが、文字のサイズやフォントの変更の仕方がわかりません。 方法を教えていただけると助かります。 よろしくお願いします。

  • pdfファイのテキスト化

    「Adobe Reader 7.0」でpdfファイルを見ています。このpdfファイルのデータをテキストデータとして保存する方法はどのような手順で行えばいいでしょうか? また「テキストとして保存」としてもテキストファイルは出来るのですが中身が無い状態です。

  • PDFそのものから、テキストの抽出

    PDFそのものから、テキストの抽出は可能ですか? Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。 ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか? 逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

  • PDFファイルから Word 2003 のファイルへの変換の仕方を教え

    PDFファイルから Word 2003 のファイルへの変換の仕方を教えてください。 Adobe Acrobat 7.0 Standard で読み込んだPDFファイルを「OCRを使用してテキストとして認識」させた後、「名前を付けて保存」「Word文書*.doc」を選択してやってみたのですが、文字化けしたり、一部が縦書きになるなど、もうむちゃくちゃな文書になってしまいます。 どうすれば、うまく変換できるのでしょうか。教えてください。 また、Adobe Acrobat 7.0 Standard で開いたPDFファイルを編集することはできないのでしょうか。 合わせてそれも教えてください。お願いします。

  • 重いPDFファイルを軽くする方法は?

    ちらしなど印刷物の1枚もののPDFファイルを 仕事で受け取る事が時々あるのですが、 やたら重いんです。 5MBとか10MBとか。。。 家電メーカーなどのサイトで公開されている 製品パンフレットのPDFファイルなどを見ると、 数ページもののパンフレットなのにとても軽いので、 何かPDFを軽くする方法があるんだと思いますがわかりません。 受け取ったPDFファイルを軽く加工する方法を教えて下さい。 PDF加工ソフトの「adobe acrobat 5.0」を持っています。 なお、文字を画像化?すると重くなるというのは聞きましたが、 受け取るPDFファイルの文字は画像化されていません。 (acrobatのテキストツールアイコンで文字を触ると文字選択できる... ということは画像化されていないって事ですよね)

  • 【PDF】Bullzip PDF Printer でPDF化したファイルのテキストについて

    Bullzip PDF Printerを使ってPDF化したらしいファイルがあり、 Adobe Readerで開くとPDFでは正常に日本語も表示されているのですが、 テキストで保存を実行する、もしくはテキストをコピーして テキストエディタに貼り付けを行うと一部が文字化けしてしまいます。 例えば、「金融」という言葉が「・融」となったり、「1ヶ月」が 「1ヶ・」になったりします。 正しい日本語で表示させたいのですが、何か良い方法はありますでしょうか。

  • PDFファイルの編集について

    初歩的な質問ですみません。国税局からDLしたPDFファイルに住所などを記入しようとacrobat6を使って試してみたのですがプロテクトがかかっているのか全く文字入力などができません。PDFファイルの編集はacrobatを使っても不可能なのでしょうか?どなたかが裏技としてイラストレータで読み込んでテキスト入力してまたPDFで保存する、という方法を書かれておられましたが・・4日までに出さないといけない書類で少しあせっています。acrobatは全くの初心者です。よろしくお願い致します。

  • PDFからテキストだけ抜き出すには

    OCR機能のついたフリーソフトのクセロReaderZeroを使ってテキストの埋め込まれたPDFファイルを作りました。ここからノートパッドかワードにテキストだけコピーしたいのですが、どのようにしたらいいのかわかりません。教えてください。(このソフトのほかにAdobe Reader 8 と Adobe Acrobat 6 をインストールしてあります。)