• 締切済み

pdf検索時のトラブル

とある学術雑誌のpdfの英語論文の文字列検索ができません. 文字列をコピーして,メモ帳に貼り付けると文字化けしてしまうので,コードの問題かと思われます. そのテキストファイルをIEで開いてエンコードを変換してもうまくいきません. 原因と解決方法をご提示ください. 尚,他のpdfは普通に検索できます.

みんなの回答

回答No.2

文書のプロパティの概要のところで、  アプリケーション  PDF変換 の項目を教えていただけると、ソフトウェア固有の サポート情報等が調べやすくなります。 たとえば、MacOS X Panther(PDF変換ソフト) で作成した PDF の場合、2バイト文字の検索・コピー&ペーストができない 障害が公開されていました。 それと他の PDF というのは、同じ雑誌に掲載されている 他の PDF もですか?

Dicynodon
質問者

補足

アプリケーションは空欄になっています. pdf変換は「Acrobat Distiller 4.0 for Windows」です. 同じ雑誌の他のpdfは今やってみましたが,検索可能でした. こちらのpdfではアプリケーションは「3B2 Total Publishing System 8.07e/W」,pdf変換はAcrobat Distiller 5.0.5(Windows)」となっています.

  • fukuchan7
  • ベストアンサー率51% (156/302)
回答No.1

文字列の検索の意味は、分かりませんが、操作内容を見ますと、PDFの文字列をメモ帳にコピーしたいと言うことのようですね。 私のPCはメモ帳を削除していますので、このような状況の処理はWORDで行っていますのでその解決方法をお知らせします。 原因ですが、PDFの文字選択機能を使ってコピーしてWORDに貼り付けるとフォントがWORDにインストールされている図形文字等で表示されることにあります。 したがって、解決方法は、もう一度WORDに貼り付けた文字列をドラックしてフォントをMS明朝等日常的に使用するフォントに変更すると原文どおりに表示されます。 試して下さい。

Dicynodon
質問者

補足

検索というのはAcrobat readerの編集メニュー→検索のことです.WORDにコピーした文字列は最初から明朝体になっています.

関連するQ&A

  • PDFファイルからテキストを取り出す方法。

    英語の論文のPDFファイルがあります。これを翻訳ソフトに渡すためテキストに変換したいんです。 しかしPDFから全テキストを選択し、それをテキストファイルにペーストすると、文字列”fi”が” ̄”に、”fl”が”゜”に、”effect”が”eRect”に化けたりします。こういった文字化けの種類が多いので、一括置換機能を使っても全種類置換していくとなると大変手間がかかります。 PDFを正常にテキストファイルに出来るソフトを教えていただけないでしょうか。

  • PDFファイルをテキスト形式で保存したら文字化けしてしまう

    ドイツ語で作成されたPDFファイルをテキスト形式で保存した所、エンコードされず文字化け(コード?)してしまいます。どなたか外国で作成されたPDFをテキスト形式で保存した場合の文字化け改善方法を教えてください。お願いします!!

  • Google検索履歴のテキストファイル化 (文字化けする)

    Googleの検索履歴をテキストファイルに落として読みやすくしたいのですが、文字化けのような状態で読めずにいます。 どうすれば読めるようにできるのでしょうか? ・環境 Googleツールバー Ver4.0.1601.4978-big/ja(GGLJ)(最新Verかどうか不明です。http://toolbar.google.com/T4/intl/ja/index_xp.html を確認したのですが記載されてない?) IE Ver7 ・状況 検索履歴っぽいファイル C:\Documents and Settings\[ユーザ名]\Application Data\Google\Local Search History\google%2Eweb.w をコピーしてファイル名をA.txtにしてメモ帳で開くと文字化けしておりかつ改行されておらず読めません。 IE7で開くと英字部分は読め、改行もされているのですが、日本語部分が読めません。 例えば検索履歴の中の「漢字」という文字はエンコード「日本語(シフトJIS)」で「"oW[」と表示されています。 エンコードを「自動選択」「日本語(自動選択/シフトJIS/EUC)」「Unicode(UTF-8)」に設定したのですがどれも読めません。 文字コード変換ソフト QKC ( http://www.vector.co.jp/soft/win95/util/se065175.html ) を使って変換しようと試みたのですが、 バイナリではないかというエラーが出て変換できません。 Google独自の文字コードなはずは無いと思うのですが、文字コードについての知識が無いため解決できずにいます。 分かる方がいらっしゃったら教えてください。よろしくお願いします。

  • PDFから文字化けしないテキスト変換方法は?

    スキャンスナップで自炊したPDFファイルをOCR処理や文字をメモ帳にコピペしテキストファイル化すると、どうしても文字化けしてしまいます。保存の形式も色々と試しましたが中国語みたいな漢字に変換や文字抜けが発生します。文字化けしない良い方法はありますか?ご教示よろしくお願いいたします。

  • PDFの文字検索ができない

    PDFからPDFを作成すると、Truetypeフォントが文字検索の対象になりません。 また、その検索対象にならない文字を選択してメモ帳など貼り付けると、文字が化けます。 PDFからPDFを作るのをやめるか、フォントを変更すればよいのでしょうが、 システムの仕組み上、どちらもできません。 何かよい解決方法はありませんでしょうか?

  • 【テキスト】文字化けの修正

    雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 しかしPDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままですした… 他にどのような対処方法があるでしょうか?

  • 文字化けを正常にするには

    雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 しかしPDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままでした… 他にどのような対処方法があるでしょうか?

  • 【PDF】これはOCRなのでしょうか?

    エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか?

  • PDFで落としたんですが・・・

     英語論文をPDFで落としました。この文章をワードに 変換することはできないのでしょうか? PDFテキストをコピーして貼り付けがどうやら出来ないみたいです。 よろしくお願いします。

  • evernoteでpdfファイル内の文字列検索につ

    evernoteに取り込んだpdf内の文字列検索についてです。 テキストなどを取り込んだものの場合はそのノートの中の単語がハイライトで表示されますが pdfファイルだと、そのようには表示されません。 その単語が含まれるpdfファイルが検出されるだけなのでしょうか?

専門家に質問してみよう