• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:PDFファイルの文章を正しく認識させる方法)

PDFファイルの文章を正しく認識させる方法

このQ&Aのポイント
  • 外国製製品の説明書はPDFファイルで探していたが見つからず、スキャンしてPDFにする方法も上手くいかない。
  • プリンターやソフトウェアの設定に問題がある可能性がある。
  • 過去に英文のPDFファイルを正しくコピーできた経験がある。

質問者が選んだベストアンサー

  • ベストアンサー
  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.3

>それで、何とかプリンターで、同府されていた説明書 >をスキャンしてPDFファイルに変換して、メモ帳 >やWordにコピーし、貼り付けで、英文で保存して、 > 翻訳ソフトで和訳したいと思って試してみたのですが >、結局上手く行きません。 EPSON Scan でPDFに変換すると、 文字情報をつけてくれますが、 基本的に日本語のみです。 > 別な方法も一応試してはいます。 > 説明書をスキャンして、BMPファイルやJPEGファイル > で保存して、OCRソフトで文字認識させて、メモ帳 >やWordにコピーし、貼り付けする方法もあるのでし > ょうが、しかしこの方法だと手間がかかり過ぎます。 これしかないでしょう。 けれど、付属ソフトの読んde!!ココで直接スキャンすれば スキャン画像を保存という手間は省けます。 英語モードにするのをお忘れなく。 A4で1ページぐらいまでなら、 いろいろ作業することを考えれば手で入力した方が早いです。

参考URL:
http://faq.epson.jp/faq/01/app/servlet/qadoc?QID=031724
jepense2307
質問者

お礼

shintaro-2さん、有難うございました。 詳しい情報を頂き、大変うれしく思って います。 別な意味で、実りある情報を得られました。 早速「読んde!!ココ」をダウンロードして、 インストールして使っています。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • angel2015
  • ベストアンサー率21% (126/590)
回答No.2

妙な質問だなと思って様子を見ていたのですが No.1の方の回答を見て思ったのですけど >OCRソフトで文字認識させて、メモ帳 >やWordにコピーし、貼り付けする方法もあるのでし >ょうが、しかしこの方法だと手間がかかり過ぎます。 これが解決策ですよね

jepense2307
質問者

お礼

angel2015っさn、回答、有難うございました。 手間がかかっても、OCRで文字認識させるのが 一般的のようですね。 ただPDFファイルの文章部分をコピーして、 Wordなどに貼り付けて上手く行く場合もあるようです。

全文を見る
すると、全ての回答が全文表示されます。
  • Prome_Lin
  • ベストアンサー率42% (201/470)
回答No.1

よく分からないのですが、普通「スキャナ」でスキャンして、pdfファイルにしたとしても、画像です。 文字は、文字として取り出せないはずです。 単に画像を切り抜いておられるだけではないのですか? 私は、「Acrobat Reader」ではなく、お金を出して買った「Acrobat pro DC」を持っていますが、スキャナでpdf化したファイルから、文字は取り出せません。

jepense2307
質問者

お礼

Prome_Linさん、有難うございました。 文字も引き出せる場合もあるようですが、 今回の問い合わせのように、英語表示が 漢字で表示されてしまう事があるようです。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • pdfファイルの文章をコピーしたい

    pdfファイルの文章の、内容で部分的に文章をコピーしたいのですが、まったくできません。 文章のコピー貼り付けができれば非常に効率がいいのですが、どなたか文章の一部等を ワードみたいに普通にコピーをして貼り付けする方法やツールをしってる方いたら教えてください。 大変困っています。m(__)m

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • PDFのOCR化でファイルサイズが小さくなる理由

    すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  • スキャナで取り込んだPDFファイルを簡易編集したい

    雑誌をスキャンしてPDFファイルとしてPCに保存したのですが、まだ画像として読み込んだだけで、OCR処理もしていません。 そのファイルにアンダーラインを引いて、Kindl paper WhiteやiPadで読めるようにしたいです。 そこで質問ですが、 1.OCR処理ができて簡単な編集ができるフリーウェアはないでしょうか?   (5000円くらいであれば有料版でもいいです。) 2.Wondershareというフリーウェアを使ってOCR処理とハイライトは   できたのですが、kindlで表示したらハイライトした部分だけ見られませんでした。   有料版に切り替えれば見られるようになるのでしょうか? 3.PDF-XChange Viewerの使い勝手はどうでしょうか?   こちらは部分的なハイライトができませんでした。(スキャンデータが斜めだったから?) PCはWindows7です。 よろしくお願いします。

  • PDFファイルの編集

    お世話になります。 スキャナ等で取り込んでPDF形式で保存したファイルを、取り込んだ解像度の悪いものの場合、影やゴミのようなものを後処理できれいな白黒ファイルに修正することは可能でしょうか? 今はPDFデータをまずAdobeReader7.0で読み込んでいるのですが、他のOCRで読み込むときにきちんと文字として認識できるように、 例えばPDFデータをAdobeReader7.0で読み込んだときに、表示の拡大率を上げてページコピーしてペイントなどに貼り付けたとしてもそれは見かけ上の問題だけでもとのPDFファイル自体を修正したことにはならないでしょうか? PDFファイルをコピーしてペイントに貼り付けたもの(BMP)を読み込んでPDFファイルとして取り込んである文字をテキストに変換したいのですが、きれいに文字を認識してくれません。 例えばPDFファイルに「あいうえお」とあったとしますと変換作業後は例えですが「あ;11E!?」文字化けのようになってしまいます(うまくいく箇所もあるのですが・・・)。 本格読み取りと言うソフトを使ってExcelファイルに変換しようとしています。 わかりにくい説明ですみません。 どなたか良い方法をご教授ください。よろしくお願いいたします。

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • PDFのOCR化でファイルサイズが小さくなる理由

    以下の質問に回答して下さった方、有り難うございました。 何かの手違いで、お礼を言うおうとしたら、会員IDまたはパスワードが違うといわれ、はねられてしまいます。 なので、これを利用してお礼を言わせていただきます。 ------------------------------- 暇なときにでも すみません。  どなたか、回答よろしくお願いします。  印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。  これはなぜでしょうか。  最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。  そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。  でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。  そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。  よろしくお願いします。

  • word2010でpdfを見る方法

    word2010でpdfを読み込みたいんですが 添付した画像のとうり文字化けします。 どのようにしたら、文字化けせずに見れますか? pdfファイルの文面などをコピーして wordの作業画面に貼り付けをしたいのですが・・ よろしくお願い致します。

  • 【PDF】Bullzip PDF Printer でPDF化したファイルのテキストについて

    Bullzip PDF Printerを使ってPDF化したらしいファイルがあり、 Adobe Readerで開くとPDFでは正常に日本語も表示されているのですが、 テキストで保存を実行する、もしくはテキストをコピーして テキストエディタに貼り付けを行うと一部が文字化けしてしまいます。 例えば、「金融」という言葉が「・融」となったり、「1ヶ月」が 「1ヶ・」になったりします。 正しい日本語で表示させたいのですが、何か良い方法はありますでしょうか。

  • PDFファイルをJPEGかビットマップで保存できますか?

    会社のスキャナーで書類を読み込むと、自動的にPDFファイルが作成され、そこに画像が表示されます。(他の部署の所有物なので、この設定は触らずにおきたいです) 読み込んだ画像(書類)の使用目的は、ワードかエクセルに画像として貼り付けて、そこに書類の説明(記入方法など)をテキストボックスやオートシェイプで書き加えることです。 PDFのままではワードやエクセルに画像として貼り付けることは不可能ですよね? そこで、スキャン後自動的に作成されたPDFをそのままJPEGかビットマップで保存したいのですが、どうしたらいいでしょうか。 「名前をつけて保存」でファイル形式を選択すればいいのかと思ったのですが、ファイル形式のプルダウンメニューにはPDF以外ありませんでした。 仕方なく、PrintScreen→ペイント→貼り付け、で行っていたのですが、他に何かいい方法がありましたら教えてください。

このQ&Aのポイント
  • <カバーが開いています>というメッセージがPC側に出て印刷ができない状態です。印刷機の方には<インサツデキマス>となってにます。ちょっと前に紙つまりしていますが、詰まった紙は取り除き、その後に一度印刷に成功しています。
  • お使いの環境はMacOS10.11.6で、接続はUSBケーブルです。関連するソフト・アプリは特にありません。電話回線の種類はひかりです。
  • この問題の解決方法は、まず印刷機のカバーが完全に閉まっているかどうかを確認してください。また、印刷機のパネルに表示されているエラーメッセージを解読し、対処方法を試してみてください。紙詰まりが起きた場合は、紙を取り除き、印刷機を再起動してみてください。それでも印刷できない場合は、公式サポートに連絡して問題を報告してください。
回答を見る

専門家に質問してみよう