- ベストアンサー
画像ファイルの中から 文字をテキスト化できますか?
JPGや PDFのマニュアルなど画像化されてて 文字テキスト編集できませんよね? それの 文字編集する為に 画像ファイルの中から 文字をテキスト化できるソフトってありますか? たとえば 印刷物なら OCRソフト使えば スキャナーから印刷した文字の テキスト化はできますよね それって JPGの中の 文字や PDFの文字部分のみ 取り出すことはできるのでしょうか? ご教授おねがいいたします
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
最近のOCRソフトは、画像ファイルから文字を認識するためのボタンなどが実装されていて、簡単に利用可能です。また、デジカメで撮影した画像からゆがみを補正した上で文字認識をする機能が搭載されているものもあります。 ただ、一般的なWEBにあるような画像では解像度が足りず、認識率がかなり落ちると思います。 現在「読んdeココ!! Ver.11」を使用していますが、試しにこのページを「Print Screen」でクリップボードに取り込み、何箇所か認識させてみました。 「運営スタッフに連絡」ボタン→「【運営ス如フに画」 質問概要:「質問西條77イルの中から文字をテキスト化できますか?」 質問文:「…など画像化…」→「…ちと画傾化…」 「画像ファイルの中から…」「画傾フフィルの中から…」以外はOK 左側の質問No.部分:「No1500153」「質問者:旦二臣」「ださい」以外認識不可 という感じで、小さい文字や太字は認識率が悪くなります。
その他の回答 (5)
- Quattro99
- ベストアンサー率32% (1034/3212)
最近のOCRソフトはスキャンデータだけでなく、すでに画像ファイルになっているものからも変換可能ですよ。 たいていのOCRソフトは体験版を配布していますから、確認してみてください。 PDFファイルの場合はすでに回答にあるように、ファイル中の文字がテキストとして埋め込まれていてコピーが許可されていれば簡単にコピーできます。PDFファイル中の文字が画像としてしか入っていなかったり、テキストとして入っていてもコピーが許可されていない場合は、キャプチャーし画像ファイルにしてOCRソフトを利用するしかないのではないかと思います。
お礼
すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました
- weiemes15
- ベストアンサー率28% (232/828)
PDFの場合、文字情報と画像情報は最初から別々に保持されていますが、JPGなどの画像ファイルをOCRソフトで認識させる場合は、文字として認識させる領域を指定してやる必要があることもあります(自動的に文字領域を探すソフトが多いですが、精度は低いです)
お礼
すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました
>JPGの中の 文字や PDFの文字部分のみ 取り出すことはできるのでしょうか ということでしたら、下記フリーソフトでできると思います。 *紙2001です。画像もそのままテキストもそのまま、テキストのみでもできます。一部HP上で機能しないものもあるようですが、お試しください。
お礼
すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました
- nikuq_goo
- ベストアンサー率46% (335/715)
不思議な質問だなぁと率直な感想を置いといて・・・ >印刷物ならOCRソフト使えばスキャナーから印刷した文字のテキスト化はできますよね スキャナでは印刷出来ません。複合機とごっちゃになってるか下の文章に置き換えるとしっくり来るかもしれません。 印刷物はスキャナで読み込んで画像ファイルにします。OCRソフトは画像ファイルから文字を抽出してテキストファイル化します。 と言うわけでOCRやスキャナの存在を知っていればテキスト化出来るか?の質問への回答は御自身でお持ちかと思います。 その上で補足させて頂きますと・・・ アルファベットのみ、数字のみの認識であればほぼ100%を誇る技術力があります。安価なソフトで対応出来るでしょう。ひらがな、漢字、もしくは混在であれば認識率はとたんに落ちます。数百万するソフトで9?%です。 よって個人的には画像→テキストはまだ実用段階ではないという認識です。 PS:手書きなら尚更です
お礼
すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました
- youkisara
- ベストアンサー率20% (202/981)
Jpegはわかりませんが、PDFは普通に文字情報読み出せますよ。 文字選択ツールという物がアクロバットリーダーにあるので、それで選択すれば文字を読み出せます。
お礼
すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました
補足
PDFのなかの 文字が 画像化されてて スナップツールでしか 切り抜けないんです
お礼
すいません お礼の入力しておりませんでした 大変遅くなりましたがありがとうございました