• 締切済み

エクセルVBAで画像から文字を抽出出来ますか?

いつもお世話になります。 エクセルで、画像の図書(PDFとTIF)の特定部分から文字と数字を抽出したいのですが そのような事は可能なのでしょうか? パソコンはWindowsXP、Excel2003、Acrobat 9が入っています。 なお、対象の画像データは、スキャナされたもので、白黒の活字になっています。 可能な場合はどの様にすれば良いのでしょうか。皆様ご教示願います。 開発のヒントとなる様なサイトも教えて頂ければと思います。

みんなの回答

  • chiune
  • ベストアンサー率24% (30/124)
回答No.2

#1のご回答にもありますように、VBAでは事実上不可能でしょう。 ※VBAでOCRソフトを作ることが出来れば可能ですが。 ただ、OCRアドインをExcelに組み込むとできるかもしれません。 今では大抵のOCRソフトがアドイン化対応しているようですので、 いろいろ調べてみてはいかがでしょうか。 自動化したい場合は、VBAだけではムリでWSHも使わないといけないかもしれませんね。

参考URL:
http://www.vector.co.jp/magazine/softnews/050402/n0504022.html
  • MackyNo1
  • ベストアンサー率53% (1521/2850)
回答No.1

そのそも画像にはテキストデータがないので、VBAでは画像からテキストを抽出することはできません。 一般的に画像からテキストを抽出するには、OCRソフトを利用します。 通常はスキャナ付のプリンタにOCRソフトが付属していますので、これを利用してその画像ファイルを開いてテキスト化するような手順になります。

関連するQ&A

  • 画像から文字を抽出するソフト

    画像から文字を抽出するソフトを探しています。 できればフリーでお願いします。 ひとつお聞きしたいのですが、ソースネクストの『いきなりPDF』はスキャナで取り込んだ画像から文字を抽出するみたいですが、元々あるJPEGなどから文字を抽出することは可能なのでしょうか? 回答お願いします。

  • PDF から文字を抽出してexcelに

    文字データとしてコピー可能な複数のPDFから特定の文字に続く文字30字を抽出し、エクセルにペーストして一覧を作ることを考えています。 excel VBA当たりで可能ではないかと思ったのですが、PDFファイルのコントロール方法が分かりませんでした。 wordならexcelでコントロールできるかもしれないと思い、複数のPDFを一括で複数のrtfに変換し、excel_VBAでwordでrtfを開くことが出来たのですが、その後の特定の文字に続く文字30字を抽出、エクセルにペーストする方法が分かりませんでした。 良い方法を御存知の方、教えていただけないでしょうか? 完成形はエクセルで下記のような形です。     A      B 1 ファイル名 抽出文字 2 3

  • PDFから画像を抽出

     個人的にPDFが嫌いなので、読みやすいhtmlかdocに変換しようと思っています。  テキストは、AdobeReaderの機能を使って抽出できたのですが、画像のほうが抽出できません。  一つ一つ取り出すのはフォト何とかツールでできると聞きましたが、全ての画像要素を一括して抽出する機能は、AdobeReaderにはないでしょうか?もしくは、そういったことができるソフト(できるだけフリーで・・・。)はないでしょうか?  なお、Acrobatは所有していません。

  • Acrobat形式のカラー画像ファイルを減色して軽くしたいのですが・・・

    スキャナで読み込んでPDF画像を作っているのですが、Acrobat形式の カラー画像ファイルで作成しています。 カラーで保存する必要もないので白黒画像にして軽くしたいと思うの ですが、減色する方法がわからず、悩んでします。 すでに原稿もなく、画質は同等のままで白黒にする方法(というより、 ファイルサイズを軽くしたいのですが)をご教授いただけませんでし ょうか? よろしくお願いいたします。 持っているAcrobatはstandard。 バージョンは7.0.5です。

  • PDFの画像データを4枚並べに出来るでしょうか

    お世話になります。 A4サイズの画像ファイルを4分割や2分割にして1枚の用紙に割り付けた感じのPDFデータを出力したいと思っています。 イメージとしてはWindowsXP「写真の印刷ウィザード」の中の9×13センチのプリント(4分割)や13×18センチ(2分割)で印刷される感じです。 「写真の印刷ウィザード」で印刷する際にプリンタをAcrobatDistilerにすればOKなのですが、けっこう大変です。 それにこの方法だとJPEGやBMPのデータは扱えますがTIFやPDFは出来ません。 Acrobatの機能で直接PDFデータを4分割などに出来ないでしょうか? またTIF画像で同じようなことができる方法があれば教えてください。 使用機種はWindowsXP、Acrobat5.0、6.0あります。

  • イラレの埋込み画像はどうして元のまま取り出せない?

    イラレの埋込み画像を抽出するとき ・イラレでコピー→フォトショにペースト ・PDF保存してアクロバットで画像を書き出し ・  〃   フォトショで開く ・プラグイン Replace Raster とかを使う などの方法があると思いますが、どの方法を使っても 元のファイル形式(EPS,TIF,JPG…)、元の解像度で抽出する方法はありません。 どうしてできないのか、理屈を教えていただけませんか?

  • 白黒2値画像が含まれるWord文書のPDF化について

    白黒2値またはグレースケール画像が含まれるWord文書を、 Acrobat DistillerまたはWordアドインに追加されるAcrobat PDF MakerによりPDF化にすると、 文書中に貼り付けた画像がすべてフルカラー画像としてPDF中に埋め込まれているようで、ファイルサイズが元のWordファイルの数倍のサイズになってしまいます。 PDF化の設定をいろいろ変えてみたのですが、どうしても白黒2値画像、グレースケール画像を元の色数のままPDF化するような設定は見つかりませんでした。 Word文章中の画像を元の色数のままPDF化する方法があれば教えてください。 ワンステップで出来なくても最終的に元の色数の画像が埋め込まれたPDFとなれば多少面倒でもかまいません。 よろしくお願いいたします。 なお、環境は、WindowsXP ProにOffice2003、Acrobat 8.0 Proを使っています。

  • Acrobat7で文書をスキャンすると文字が薄くて認識できない

    Acrobat7.0を使用しています。 ファイル→PDFの作成→スキャナで文書を取り込もうとしています。 しかし、スキャンした文書は薄くてまともに認識されません。 スキャンする画像の種類は「白黒画像またはテキスト」です。 スキャンした画像の品質の調整で明るさを調整してみても改善されません。 どのようにしたら改善するでしょうか

  • PDF からの 数値データ抽出

    PDFファイルに数値データが表として載っています。 どうにかデータ(EXCEL,CSV など)で抽出したいのですが。 そもそもPDFなので無理は承知なのですが 画像データから数字をデータとして 変換できるソフトor方法 何かありませんでしょうか?

  • Acrobat形式の画像ファイルをEXCELに載せたいのですが・・・

    Acrobat形式の画像ファイルをEXCELに載せたくて悩ん でいます。 WORDならばAcrobat画像をドラッグ・ドロップするだけ でWORD上に画像が表示されます。 EXCELで同様のことをすると、バケ字のような文字列が 並び、図を表示することができません。 EXCEL上にPDF形式の画像の挿絵を入れる方法はありま すでしょうか? ちなみになぜかPDFをいったんWORDにドラッグドロップ し、表示された画像を再度EXCELにドラッグドロップす るとうまく表示されますが、画質は使用に耐えませ ん。この方法以外でご教授いただけませんか? よろしくお願いいたします。 EXCELは2003。 PDFはスキャナで読み取った画像をAcrobat7.0でPDFに したものです。

専門家に質問してみよう