• ベストアンサー

画像ファイルの中から 文字をテキスト化できますか?

JPGや PDFのマニュアルなど画像化されてて 文字テキスト編集できませんよね? それの 文字編集する為に 画像ファイルの中から 文字をテキスト化できるソフトってありますか? たとえば 印刷物なら OCRソフト使えば スキャナーから印刷した文字の テキスト化はできますよね それって JPGの中の 文字や PDFの文字部分のみ 取り出すことはできるのでしょうか? ご教授おねがいいたします

  • p-p
  • お礼率99% (311/312)

質問者が選んだベストアンサー

  • ベストアンサー
  • sokoja
  • ベストアンサー率33% (164/491)
回答No.6

最近のOCRソフトは、画像ファイルから文字を認識するためのボタンなどが実装されていて、簡単に利用可能です。また、デジカメで撮影した画像からゆがみを補正した上で文字認識をする機能が搭載されているものもあります。 ただ、一般的なWEBにあるような画像では解像度が足りず、認識率がかなり落ちると思います。 現在「読んdeココ!! Ver.11」を使用していますが、試しにこのページを「Print Screen」でクリップボードに取り込み、何箇所か認識させてみました。 「運営スタッフに連絡」ボタン→「【運営ス如フに画」 質問概要:「質問西條77イルの中から文字をテキスト化できますか?」 質問文:「…など画像化…」→「…ちと画傾化…」 「画像ファイルの中から…」「画傾フフィルの中から…」以外はOK 左側の質問No.部分:「No1500153」「質問者:旦二臣」「ださい」以外認識不可 という感じで、小さい文字や太字は認識率が悪くなります。

p-p
質問者

お礼

すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました

その他の回答 (5)

  • Quattro99
  • ベストアンサー率32% (1034/3212)
回答No.5

最近のOCRソフトはスキャンデータだけでなく、すでに画像ファイルになっているものからも変換可能ですよ。 たいていのOCRソフトは体験版を配布していますから、確認してみてください。 PDFファイルの場合はすでに回答にあるように、ファイル中の文字がテキストとして埋め込まれていてコピーが許可されていれば簡単にコピーできます。PDFファイル中の文字が画像としてしか入っていなかったり、テキストとして入っていてもコピーが許可されていない場合は、キャプチャーし画像ファイルにしてOCRソフトを利用するしかないのではないかと思います。

p-p
質問者

お礼

すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました

  • weiemes15
  • ベストアンサー率28% (232/828)
回答No.4

PDFの場合、文字情報と画像情報は最初から別々に保持されていますが、JPGなどの画像ファイルをOCRソフトで認識させる場合は、文字として認識させる領域を指定してやる必要があることもあります(自動的に文字領域を探すソフトが多いですが、精度は低いです)

p-p
質問者

お礼

すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました

noname#189131
noname#189131
回答No.3

>JPGの中の 文字や PDFの文字部分のみ 取り出すことはできるのでしょうか ということでしたら、下記フリーソフトでできると思います。 *紙2001です。画像もそのままテキストもそのまま、テキストのみでもできます。一部HP上で機能しないものもあるようですが、お試しください。            

参考URL:
http://rakusai.org/index.html
p-p
質問者

お礼

すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました

  • nikuq_goo
  • ベストアンサー率46% (335/715)
回答No.2

不思議な質問だなぁと率直な感想を置いといて・・・ >印刷物ならOCRソフト使えばスキャナーから印刷した文字のテキスト化はできますよね スキャナでは印刷出来ません。複合機とごっちゃになってるか下の文章に置き換えるとしっくり来るかもしれません。 印刷物はスキャナで読み込んで画像ファイルにします。OCRソフトは画像ファイルから文字を抽出してテキストファイル化します。 と言うわけでOCRやスキャナの存在を知っていればテキスト化出来るか?の質問への回答は御自身でお持ちかと思います。 その上で補足させて頂きますと・・・ アルファベットのみ、数字のみの認識であればほぼ100%を誇る技術力があります。安価なソフトで対応出来るでしょう。ひらがな、漢字、もしくは混在であれば認識率はとたんに落ちます。数百万するソフトで9?%です。 よって個人的には画像→テキストはまだ実用段階ではないという認識です。 PS:手書きなら尚更です

p-p
質問者

お礼

すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました

  • youkisara
  • ベストアンサー率20% (202/981)
回答No.1

Jpegはわかりませんが、PDFは普通に文字情報読み出せますよ。 文字選択ツールという物がアクロバットリーダーにあるので、それで選択すれば文字を読み出せます。

p-p
質問者

お礼

すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました

p-p
質問者

補足

PDFのなかの 文字が 画像化されてて スナップツールでしか 切り抜けないんです

関連するQ&A

  • 画像ファイル中の文字をテキスト化するソフト

    画像になっている文書の文字をテキストデータにする、2~3千円の安いソフトはないでしょうか。 今すぐ必要なのでダウンロードできるものがよいです。 PDFの文字をテキスト化したいのですが、コピーペーストしすると意味不明の記号になります。制限は何もかかってないし、文字列の選択もできます。 で、画像としてキャプチャして、テキストにできないかと思うのですが・・・Webで探して、高価なOCRソフトが見つかったのですが、の今回だけのために買うのはもったいないし・・・「読んdeココ」は、体験版だとクリップボードからのOCR機能がないので、だめでした。 よろしくお願いします。

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。

  • PDF内の画像文字からテキストを抽出できるOCR

    現在、PDFファイルで英文を翻訳機にかけたいと思っているのですが、20~30年前の部品のデータシートで何かスキャナーからこのデータシート資料を取り込んだらしく、文字が画像としてしか認識されずテキストをコピペすることができないのです。 文字はすべてアルファベットなどで構成されています。多少スキャン時にページが傾いている感じがあるくらいでOCRソフトのRealReader Lite 7.0でjpegファイルから”スマート認識”でとりだそうとしたのですが、 すこし誤変換が多いような気がしました。 このようなすべて画像で構成されているPDFファイルから文字のとりだしやすいOCRソフトなどご存じの方いらっしゃいませんでしょうか? ぜひ、教えて頂きますよう、お願い致します。

  • PDFでもらった文書ファイルをテキスト化するソフト?

    仕事で扱う書類をPDFファイルで渡されました。 それはつまり、すでに印刷したものをスキャナーで取り込んで、PDFに変換してあるものでした。 これを、再び文字データとして扱いたいとおもうのですが、どのようなソフトがあるのでしょうか?OCRっていうのをつかうということまではわかったのですが、 高くてもやすくても(あまり高いのは困ります) 幅広く、教えていただければと思います。 よろしくお願いします。

  • スキャナを使わずにPDFファイルの文字認識はできないですか?

    PDFファイルで画像として認識された文字を、文字として認識するには、「読んでココ」のようなOCRソフトを使ってスキャナで認識させればいいということは知っています。 しかしスキャナが壊れてしまったため、上記のような方法ができません。パソコンの中にある画像として認識しているPDFファイルを何らかのソフトを使って、文字認識できないでしょうか? フリーウェアであれば言うことないですが、2,3万円なら買おうと思っています。スキャナはA3読込可能なものを買おうと思っていますが、高いのでもうしばらく待ちたいと考えています。 どうかよろしくお願いします。

  • 画像ファイルの文字をテキストに変換

    画像ファイルの中の文字を、編集可能なテキスト文字に変換できるソフトというのはあるでしょうか。

  •  デジカメ画像の文書をテキスト化できますか?

     スキャナを持っていないので、これまで文書をパソコンに取り込むのにデジカメで撮ったものを使っていました。その画像がたくさんあるのですが、文章の編集などもちろんそのままではできませんし、なんとかテキスト化できないものかと思っています。  スキャナでとりこんでOCRで、というのは調べて知りましたが、スキャナを買わずに済む方法はないものかと考えてます。表というか罫線がたくさん入った文書が多いです。  よいソフトご存知でしたら教えてください。

  • PDFの中にある文字を1文字単位で画像化したい

    お世話になります。 PDFの中にある文字を1文字単位で画像化したいと考えております。 ※OCR変換ではなく、画像化 イメージとしては、 OCR時に、画像化された文字を1文字単位で判別→フォントに変換 をしているとおもうですが、これを 画像化された文字を1文字単位で判別→1文字単位で画像化 したいのです。 有償・無償どちらでも結構ですので、そのような変換ソフトないか 教えて頂けないでしょうか? 何卒よろしくお願いします。

  • 画像から文字認識できるソフト

    JPGやGIFなんかかの、スキャンした画像から、文字認識できるソフトってありますよね。 こういう機能のあるフリーソフトってないですか? もしくは、体験版とかでないでしょうか。 それか、 画像をPDFに変えて、そのPDFをワード等の文字を編集できるデータ-変換する、というのは可能でしょうか? (いきなりPDFとかを使って)

  • OCR

    読んでココなどのソフトで、デジカメや、スキャナーで読み取った文書は、文書でも画像として扱われますがOCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。文字の認識ができ編集や変更や書き直しができるわけでしょうか?

専門家に質問してみよう