- ベストアンサー
PDFファイルのテキスト保存
PDFからテキストに保存する際、通常ならコピペでできるのですが、↓のファイルの場合、文字化けしてしまいます。何かいい方法はありませんか? http://kokushi.job.affrc.go.jp/H15genkyou/H15syousai/13L.pdf
- non209
- お礼率91% (21/23)
- フリーウェア・フリーソフト
- 回答数3
- ありがとう数4
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
見たところ、テキストのコピー禁止とかにはなっていないようですが、 フォントのエンコーディングがIdentity-Hになっているようですね。これが原因かと。 これは、対象のPDF内部だけで有効なエンコーディングなので。 Illustratorとかに読み込めば、再変換してもとのエンコーディングに戻せる場合もありますが、Acrobatだけだと無理なような。
その他の回答 (2)
- satoumasaru
- ベストアンサー率59% (325/545)
PDFファイルは作成の際に、いろいろな制限をかけることができます。ですから、作った人が、「ファイルをダウンロードできないようにする」「テキストでは読めないようにする」とかいうプロテクトをかけることができます。このファイルはそのようなプロテクトがかかっていますので、通常ではどうすることもできません。 私の思い浮かぶ方法といえば、デジカメで撮影するかスクリーン画面の保存をするとかして画像ファイルに変換し、OCRソフトで読むぐらいでしょうか。
お礼
回答ありがとうございます。 プロパティを見る限り、セキュリティはかかっておらず、内容の抽出とコピーも可能になっています。 フリーのOCRソフトがなかったため、お試し版で読み込んで見ました。結構変換ミスがあったので、これを直す作業と、自分でイチから入力するのと、どっちが速いか微妙なところです…。
- HAL007
- ベストアンサー率29% (1751/5869)
PDFは書類の改ざんを防止しることを目的にして いますからコピーは出来ません。 可能なのは編集ソフトですがパスワードなどでプロテクと されていると思います。
お礼
回答ありがとうございます。 書類の改ざんはもちろん禁止だと思いますが、コピー・配布は自由にできるものもたくさんあります。 今回のファイルも配布資料であり、転載も許可されているものです。
関連するQ&A
- PDFファイルをテキスト形式で保存したら文字化けしてしまう
ドイツ語で作成されたPDFファイルをテキスト形式で保存した所、エンコードされず文字化け(コード?)してしまいます。どなたか外国で作成されたPDFをテキスト形式で保存した場合の文字化け改善方法を教えてください。お願いします!!
- 締切済み
- オフィス系ソフト
- 【PDF】これはOCRなのでしょうか?
エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか?
- 締切済み
- フリーウェア・フリーソフト
- PDFのデータをテキスト化すると文字化けしてしまいます・・
あけましておめでとうございます。 PDFの中のデータをテキストファイルに移行しようとしてコピペや、テキストとして保存しようとするのですが、すべての文字が、 ・・・・・・・・に文字化けしてしまいます。 なぜこうなるのか、まったく私にはわかりません。 どなたかお詳しい方、お助けください。 よろしくお願いいたします。
- ベストアンサー
- その他(ソフトウェア)
- 【テキスト】文字化けの修正
雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 しかしPDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままですした… 他にどのような対処方法があるでしょうか?
- 締切済み
- その他(ソフトウェア)
- PDFから文字化けしないテキスト変換方法は?
スキャンスナップで自炊したPDFファイルをOCR処理や文字をメモ帳にコピペしテキストファイル化すると、どうしても文字化けしてしまいます。保存の形式も色々と試しましたが中国語みたいな漢字に変換や文字抜けが発生します。文字化けしない良い方法はありますか?ご教示よろしくお願いいたします。
- ベストアンサー
- その他Adobe製品
- 【PDF】Bullzip PDF Printer でPDF化したファイルのテキストについて
Bullzip PDF Printerを使ってPDF化したらしいファイルがあり、 Adobe Readerで開くとPDFでは正常に日本語も表示されているのですが、 テキストで保存を実行する、もしくはテキストをコピーして テキストエディタに貼り付けを行うと一部が文字化けしてしまいます。 例えば、「金融」という言葉が「・融」となったり、「1ヶ月」が 「1ヶ・」になったりします。 正しい日本語で表示させたいのですが、何か良い方法はありますでしょうか。
- 締切済み
- その他(ソフトウェア)
- pdfをテキストファイルにしたいです
文書をスキャナで読み込み、ひでまるエディタでテキストファイルにしたのですが。 再度やってみたらやり方を忘れてしまってできません。 スキャナで読み込んだtifファイルを保存して、アクロバットリーダーで PDFにしました。 それを何かをして保存したらデスクトップに秀丸でテキストファイルになって保存できて いました。 再度やってみたら、どうやったのか、どうしても思い出せないのです。 それと、A5の本を見開きで横にしてスキャナで取り込んだので、文字が横になっているので( A4は縦に置かないと認識しないので) アクロバットリーダーで90度回転させ、保存しても、ファイルを開いたら 読み込んだままの90度回転した(文字が横になっている)ファイルになっています。 どうしたら文字が真っ直ぐ上を向いたままの状態で保存できるのでしょうか? 聞きたいことは、 1.PDFをテキストファイルにする方法 2.PDFのファイルを90度回転させたまま保存する方法です。 OSはWINXP アクロバットリーダーはX アクロバット スタンダード7.1もあります。 よろしくお願いします。
- 締切済み
- その他(ソフトウェア)
- スキャナーで読込み、PDFファイルからワードにコピペ
スキャナーで読込み、PDFファイルからワードにコピペ スキャナーで本を読みこみ、PDFファイルに変換しました。 PDFファイルからワードにコピペをしたら、文字化けしたような感じにしかなりません。 ネット上にあるPDFファイルをワードにコピペした際には、綺麗にコピペ出来たのですが。 何が悪いのでしょうか? スキャンの仕方が悪いのでしょうか? きれいにコピペする方法を教えていただけませんでしょうか? このようなことにお詳しい方がおられましたら教えていただけませんでしょうか。 よろしくお願いいたします。
- ベストアンサー
- プリンター・スキャナー
- pdfファイルのテキスト部分を書き出すことはできますか?
タイトルの通りなんですが… 文字情報を多く含むpdfファイルのテキスト部分だけ書き出して テキストファイルとして保存することはできるのでしょうか? Adobe Acrobat 4.0 はあります。 よい方法があったら教えてください。 よろしくお願いいたします。
- 締切済み
- その他(ソフトウェア)
- PDFファイルからテキストを取り出す方法。
英語の論文のPDFファイルがあります。これを翻訳ソフトに渡すためテキストに変換したいんです。 しかしPDFから全テキストを選択し、それをテキストファイルにペーストすると、文字列”fi”が” ̄”に、”fl”が”゜”に、”effect”が”eRect”に化けたりします。こういった文字化けの種類が多いので、一括置換機能を使っても全種類置換していくとなると大変手間がかかります。 PDFを正常にテキストファイルに出来るソフトを教えていただけないでしょうか。
- ベストアンサー
- フリーウェア・フリーソフト
お礼
回答ありがとうございます。 エンコーディングのことはよく分からないのですが、「Identity-H」を使っているほかのファイルではテキスト保存ができたので、原因不明です…。 Illustratorでうまく再変換できることを祈ります。