• ベストアンサー

PDF からの 数値データ抽出

PDFファイルに数値データが表として載っています。 どうにかデータ(EXCEL,CSV など)で抽出したいのですが。 そもそもPDFなので無理は承知なのですが 画像データから数字をデータとして 変換できるソフトor方法 何かありませんでしょうか?

  • UWHD
  • お礼率56% (34/60)

質問者が選んだベストアンサー

  • ベストアンサー
  • saru1234
  • ベストアンサー率37% (223/593)
回答No.3

まず、PDF といってもビットイメージの場合があります、 この場合はちょっと除外します。 文字コードで書かれてる場合(文字で検索するとヒットする)は、 <Alt>を押しながらだと四角形で範囲指定できますから、これで スペース区切りでコピーが取れます。 そのまま Excel に貼り付けると、横1列xタテ数行に貼りつきます。 このままでは横方向は1列のみ使ってる状態なので、 スペースで区切って複数セルに分割する操作をします。 対象セルの列を選択し、データ(D)→区切り位置(E) で子ウィンドウを開き 「元のデータ形式」で ●カンマやタブなどの... のラジオボタンにマークを入れ [次へ(N)]「区切り文字」で チェックボックス ■スペース にチェックを入れます。 この時に下の小窓に区切りの具合が表示されますから これで問題なさそうなら ボタン[完了]を押すと実行します。 これで横方向も複数セルに分割されます。 あと、あとで気付いたのですが、この分割ルールはその後も機能しているようで、 以降は「内容がスペース区切り状態」の文字列ペーストを?貼り付けると、 横方向を自動的に複数セルに分けて格納してくれれます。 以上は Excel2003 で確認したことですが、他バージョンでも同様かと思います。

UWHD
質問者

お礼

非常に丁寧にありがとうございました。 今回は上記手順ではできませんでした BITイメージか作成先でなにかしているとは思います 今後の参考になりました ありがとうございました。

その他の回答 (5)

  • imogasi
  • ベストアンサー率27% (4737/17068)
回答No.6

http://internet.watch.impress.co.jp/cda/biz_tool/2008/09/09/20801.html のような記事がある。使えないでしょうか。 PDFはテキスト(文字コードで)も併せ持つ場合がある。 その場合検索文字指定で検索が出来たりする。 http://oshiete1.goo.ne.jp/qa3503153.html 参考

UWHD
質問者

お礼

一応質問の問題は解決したのですが この参考URLは非常におもしろかったです 今後の参考にさせていただきます。 ありがとうございました。

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.5

こんばんは。 >画像データから数字をデータとして 変換できるソフトor方法 >何かありませんでしょうか? 別に、データが埋め込みされているなら、それは、いずれにしても、テキストデータは取れるでしょうけれども、私の経験では、列と行の関係がうまく行きませんでした。 データが埋め込みなされていなくても、OCR(『読んde!ココ』など)で取れば出来ます。そちらのほうが楽です。そして、やはり、OCRの専門メーカーのものが良いと思います。仕事の原稿(PDF)は、100%データ埋め込みされていませんから、それが出来ないなら、私は仕事になりません。 p.s.以前、私がいろいろ使っていたOCRの評価は、現在、かなり変わってしまいましたが、上記の『読んde...』は、表には格段に強いようですね。

UWHD
質問者

お礼

開発関係の書類なので データは取れませんでした。 おっしゃるようにスキャナー&OCRにて 問題は解決しました。 少し面倒ですが 仕方ないですね ありがとうございました。

  • saru1234
  • ベストアンサー率37% (223/593)
回答No.4

ANo.3 です、足りなかったので補足。 > <Alt>を押しながらだと四角形で範囲指定できますから、これで > スペース区切りでコピーが取れます。 これは Adobe Reader 7 でのハナシです。現在流通してるのは Ver9 になってるようですが、 基本的操作は多分変わってないと思います...

回答No.2

右クリックして「すべて選択」で 全部選択出来ればコピペできますよ。

UWHD
質問者

お礼

前選択できません・・・。 他にも試してみます

  • n-jun
  • ベストアンサー率33% (959/2873)
回答No.1
UWHD
質問者

お礼

参考URLありがとうございます。 いろいろ見てみます

関連するQ&A

  • PDFの画像を抽出

    PDFの画像を抽出したいのですが、 スナップショットツールでやった見たところ、 だいぶ画質が落ちていて、使い物になりません。 PDFの画像を抽出するソフトを探して、「Pto BMP」 と言うソフトを使ってみたのですが、どうやらそのソフトを使うには「Bto PDF」で変換したPDFファイル でないと変換できないようなので、他のソフトを 探したのですが、なかなか見つかりません。 他に良いソフトはないでしょうか。

  • Excel2002 データの抽出

    Excel2002で塗りつぶしたデータの抽出をしたいのですがうまくいきません。やはり値でないと抽出できないのでしょうか? 一覧の表のデータの中でいくつかの行だけ塗りつぶしをしてあります。この塗りつぶしをした行だけ抽出したいのですが無理ですか? どなたかよろしくお願いします。

  • 指定した数字が含まれる組合せを抽出する。

    どなたかご存じでしたら回答をお願いします。 数字選択式宝くじの「ミニロト」の組合せをフリーソフトで作成&CSVデータに出力しています。 これをエクセルに取りこむと下記のようになります。 【作成されてエクセルに取りこんだCSVデータ】 01 04 06 07 22 01 06 07 13 22 01 06 07 22 27 03 04 11 13 29 04 13 15 18 27 ここから、「指定した数字の○ or ○ or ○ or ○ or ○が含まれる組合せを抽出する。」 というのをエクセルでやりたいですがどうやればよいでしょうか? できれば1回の操作で結果が出るのがよいです。 上記例でいうと、「指定した数字の4 or 13 が含まれる組合せを抽出する。」と指定すれば 下記抽出結果が得られる。 【抽出結果】 01 04 06 07 22 01 06 07 13 22 03 04 11 13 29 04 13 15 18 27 CSVデータは1個~169911個まであります。 指定された数字が第1数字~第5数字のいずれかに入っていれば抽出対象です。 指定する数字は1個~5個です。 エクセルの操作およびVBAでのソースを教えて下さい。 よろしくお願いします。

  • PDF から文字を抽出してexcelに

    文字データとしてコピー可能な複数のPDFから特定の文字に続く文字30字を抽出し、エクセルにペーストして一覧を作ることを考えています。 excel VBA当たりで可能ではないかと思ったのですが、PDFファイルのコントロール方法が分かりませんでした。 wordならexcelでコントロールできるかもしれないと思い、複数のPDFを一括で複数のrtfに変換し、excel_VBAでwordでrtfを開くことが出来たのですが、その後の特定の文字に続く文字30字を抽出、エクセルにペーストする方法が分かりませんでした。 良い方法を御存知の方、教えていただけないでしょうか? 完成形はエクセルで下記のような形です。     A      B 1 ファイル名 抽出文字 2 3

  • CSVデータの数値の表示

    教えて下さい。 他プログラムからCSVデータ出力したデータを エクセルで表示すると、13桁の数字が9E+12と表示されて しまいます。 セルの書式設定を「数値」に変更すると一時的に数字が表示されるのですが、一度保存して、再度ファイルを開くと戻ってしまいます。 エクセル形式で保存すれば大丈夫なのですが、どうしてもCSVファイルのままで保存したいのです。 CSVデータで13桁の数字を常に表示する方法を教えて下さい。 よろしくお願いします。

  • PDFそのものから、テキストの抽出

    PDFそのものから、テキストの抽出は可能ですか? Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。 ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか? 逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

  • エクセル 数値の抽出方法

    どなたか教えて下さい エクセルで沢山の数値(同数値含む)が入っている表から同数値を除く 数字の種類を抽出したいのですが、その方法が判りません 例)   A   B   C 1 0.20 0.20  0.15 2 0.15 1.00  0.15 3 0.33 0.40  0.10 4 1.00 0.20  0.15 上記の例の場合抽出結果を 0.10 0.15 0.20 0.33 0.40 1.00 と表示させたいのですが、どなたか教えて下さい よろしくお願いします。 

  • 「いきなりPDF」データ抽出時のエラーメッセージ

    いきなりPDF>>変換メニュー 【出力ファイル形式を選ぶ】出力形式:テキスト(データ抽出) で実行したときに、「PDFファイルにテキストデータがないため、ファイルの出力ができませんでした」とのエラーメッセージが出て、処理が止まってしまいます。 プレビュー画面には問題なく表示されています。 出力形式をテキスト(文字認識)にすると、出力されます。 テキスト(データ抽出)するためのエラー回避方法があればお教えください。 ※OKWAVEより補足:「ソースネクスト株式会社の製品・サービス」についての質問です。

  • エクセルのデータから別のエクセルのデータを引く

    エクセルのcsvファイルが2つあります。 一つのcsvファイルのデータから、もう一つのcsvファイルのデータを引きたいのですが、方法を伝授していただけますでしょうか。 詳しく言いますと、一つのcsvにはニックネームが200件あり、もう一つのcsvにはニックネームが150件あります。 「200-150=50」 2つのcsvにカブっていないデータを抽出したいのです。 Microsoft Excel 2003を使用しています。 よろしくお願いします。

  • PDFから画像を抽出

     個人的にPDFが嫌いなので、読みやすいhtmlかdocに変換しようと思っています。  テキストは、AdobeReaderの機能を使って抽出できたのですが、画像のほうが抽出できません。  一つ一つ取り出すのはフォト何とかツールでできると聞きましたが、全ての画像要素を一括して抽出する機能は、AdobeReaderにはないでしょうか?もしくは、そういったことができるソフト(できるだけフリーで・・・。)はないでしょうか?  なお、Acrobatは所有していません。

専門家に質問してみよう