• 締切済み

透明テキスト付きPDFの容量

写真付きの原稿をスキャナーでPDFにする場合、単純なPDFにすると200KBくらいですが OCRをかけて「透明テキスト付きPDF」にすると1MB以上になります。 この容量の違いはこんなものなのでしょうか。 それともスキャナーによる違い、OCRによる違いがあるのでしょうか?

みんなの回答

  • PrintScree
  • ベストアンサー率25% (538/2091)
回答No.1

スキャナで読み取る時の解像度と原稿サイズに依存します。 透明テキスト付きPDFの場合、スキャンした画像が見え、文字列検索する時はOCR文字を検索する形式ですので、画像ファイルをPDFにしたときプラスαのファイルサイズになります。

関連するQ&A

  • いきなりPDFで変換するとファイル容量が大きくなる?

    いきなりPDFを使用しています。 スキャナーで取り込んだJPEGのファイルをいきなりPDFで変換すると、692KBから2.12MBに増えてしまいました。 PDF化すればファイル容量は減ると思っていたのですが、どうしてでしょうか? どなたか教えてください。

  • PPTをPDFに変換すると容量がアップしてしまいます

    パンフレット(画像&文字)をパワポで作成(786KB) ↓ いきなりPDF でPDF化 ↓ PDFデータの容量が4.62MBにまでアップしてしまいます。 PPT原稿で常用フォントではない「Eurostile LT Extended」というフォントを使用しているため、いきなりPDFのプロパティで新規設定(フォント埋め込み)を追加しています。 (ちなみに初期設定されているものは編集&削除はできませんでした。) せめて1MBにおさめたいのですが、写真の画質も下げたくありません。 どうすれば解決するか教えてください。 基本的に、なぜPPTからPDFにすると容量がアップしてしまうのか、その理由も教えていただけると助かります。 (パワポは2003、いきなりPDFはProfessional2 というものです。) 宜しくお願いします。

  • Excelに画像を挿入しPDF化すると容量が大きくなる

    Excelファイル33KBにJPEG画像27KBを挿入しPDF化すると1MB以上に容量が大きくなってしまいます。 100KB位に、大きくても500KB以下に小さくする方法はないでしょうか?

  • PDF と pdf で容量がまったく違うのですが…

    PDF と pdf で容量がまったく違うのですが何故なのでしょう。 Autocadで完成した図面を、PDFに変換して、お客様にメールで送っているのですが、見た目同じ様な図面でも、PDFに変換すると、まったく違う容量差のファイルができます。そして、そのファイルの拡張子を見ると、大文字の PDF と 小文字のpdf が勝手に出来ており、大文字のPDFが11,349KBに対し、小文字でできたpdfは41KBなのです。 容量がまったく違うのですが何故なのでしょう。 拡張子の文字の違いも踏まえ教えて頂けると幸いです。 メールに軽いファイルで添付支度、そお他の方法などありましたら、 追加でご教授の程、どうぞ宜しくお願い致します。 ご回答有り難うございます。 両方とも、同じ手順で、同じ様に変換しているのですが、数千倍になってしまうのでした。 どうも、いまいちわかりませんです。引き続き宜しくお願い致します。

  • 写真入り原稿をテキスト化

    手持ちの本を電子書籍化したいのですが、写真入り原稿をテキスト化した場合、殆んどのOCRでは文書はテキスト化されますが写真は消えてしまいます。 写真入り元原稿のレイアウトまま文書だけテキスト化できないでしょうか。

  • 透明テキスト付きPDFへの変換ソフトを紹介して

    複数の英語の書籍を、画像スキャナーで読み込んで、PDFに変換してファイル化しています。いずれもページ数は500枚から700枚程度です。 これを透明テキスト付きPDFにして、Acorbatで検索できるようにしたいと考えています。 そこでこれらの画像PDFファイルを、OCRでテキスト化し、その上で各ページに透明テキストを埋め込んでくれるソフトを紹介してくださいませんか。 特にOCRに日本語がなくても結構です(もちろんあればそれにこしたことはありませんが、限定しません)。 また価格はできれば安いにこしたことはありませんが、特にこれも限定しません。なおソフトよりもハードを買った方が安いとのご提案があれば、そのご提案も歓迎したいと思います。 私は現在日本国外におり、情報に疎い状況にあります。 ただ申し訳ないのですが、いくつか条件があります。 1)元のPDFファイルはそのままで、透明テキストを付加したいのです。  PDFファイルは、深い階層までしおりを付けています。これを崩したくありません。  また以前持っていたe.Typistは、元のPDFをページごとにPDFファイルとしてしまうため、再度結合(組み立て直しを)せねばなりませんでした。  元のPDFファイルのページ数が500枚以上あるため、できるだけ面倒な操作をしたくないのです。 2)PDFのバージョンは、古いPDFで(できればAcrobat6で)保存したい。 3)ソフトウエアの場合、できればダウンロード販売のあるものが良い。 以上、よろしくお願いいたします。

  • スキャナで作成したPDFからテキスト抽出

    会社で過去の書類を大量にスキャナでPDFにしてあります。(数千ファイル程度) これらに中身がわかるようなファイル名を付けるために、PDFの中身を見てファイル名を付けるという作業をやることになりました・・・ それでどなたかご存知であればお教え願いたいのですが、下記要件を満たすソフトウェアはありませか? ・スキャナで作成したPDF(つまり画像ですね)からOCR的にテキストを抽出できる。 ・コマンドラインで動作する。(数が多いのでプログラムを書いて自動化したいのです) ・価格は5万円以内(できたら2万円以内です。購入は自腹になると思いますので、これ以上は厳しいです)

  • ホームページ上に公開するPDFの容量について

     ホームページ上(公的)に公開するPDF文書の重さについて、どの程度までが許容されると思われるか教えてください。  一般に通常のページは100KB~せいぜい200KB以内程度が適切な限界かと思いますが、PDFの場合、どの程度でしょうか?  またアクロバットスタンダードで、ワード文書(写真入)をPDF化するとき、容量を小さくするにはどうすれば、よいでしょうか?  よろしくお願い申し上げます。

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • 「パーソナル編集長 Ver.13」PDF軽くしたい

    パーソナル編集長13ユーザーです。 以前の質問では大変お世話になりました。おかげさまでPDF化してアップロードすれば完了のところまで来ています。 しかし、PDF化したときに、ほんの少しだけデータ容量が大きくて、アップロードの制限にかかってしまいました。 作成中の内容は、写真、画像貼り付け、テキストがあり、パーソナル編集長上では「768KB」ですが、PDFにすると「2,080KB」で、2MBのアップロード制限に引っかかってしまいます。 あともう少しだけ、画質など落とさずに削ることはできますでしょうか。 (写真、画像はこれ以上の低解像度はしたくないです・・) どうぞよろしくお願いします。 ※OKWAVEより補足:「ソースネクスト株式会社の製品・サービス」についての質問です。

専門家に質問してみよう