• 締切済み

PDF から文字を抽出してexcelに

文字データとしてコピー可能な複数のPDFから特定の文字に続く文字30字を抽出し、エクセルにペーストして一覧を作ることを考えています。 excel VBA当たりで可能ではないかと思ったのですが、PDFファイルのコントロール方法が分かりませんでした。 wordならexcelでコントロールできるかもしれないと思い、複数のPDFを一括で複数のrtfに変換し、excel_VBAでwordでrtfを開くことが出来たのですが、その後の特定の文字に続く文字30字を抽出、エクセルにペーストする方法が分かりませんでした。 良い方法を御存知の方、教えていただけないでしょうか? 完成形はエクセルで下記のような形です。     A      B 1 ファイル名 抽出文字 2 3

みんなの回答

noname#192382
noname#192382
回答No.1

wikipediaによれば、open office.org はpdfと相性が良いと書いています。open office.org はexcelともテータやり取りが容易ですから、結論として、pdfをopen office.org に取り込み、希望の処理をした後、excel形式で出力したらいいと思います。お試しあれ。

pikopiko29
質問者

お礼

「open office」は始めて知りました。 使い方を勉強してみます。

関連するQ&A

  • Wordのデータをエクセルに移す時に文字化けする。

    Wordのrtfデータをエクセルで開くと「é」の文字が文字化けしてしまいます。 作った人はフランス語として作成しているみたいです。 文字化けせずにエクセルに移すことは出来るでしょうか。 尚、一行づつコピーペーストすると文字化けせずにコピーできます。 ただし、文字が多くていちいちコピーペーストしていられません。 どなたか解決方法をご存知でしたら教えてください。

  • pdfファイルから、テキストを抽出したい

    pdfファイルから、テキストを抽出したいと思っています。 テキスト選択ツールで、テキストを選択し、コピー&ペーストでも良いのですが、これだと一ページずつ細切れになってしまいます。 何とか、これを一度で、コピー&ペースト、ないし、抽出できる方法はないでしょうか?

  • 複数のファイル(html・txt)から文字抽出

    こんにちは。 複数のファイルから特定の文字を抽出する方法を考えています。 出来るのか出来ないのかも自分ではわかりませんでしたので質問させていただきました。 やりたいこととしては 50000を超えるファイル内部の特定の記述部分を抜き出したい。 (抜き出す or 残す(その記述以外の文字は不必要なため)) ファイルの中に記述されている残したい文字は user="*****" の*****部分。 *****は数字が連番で振られている。 複数のファイルから文字を抽出するToolとか方法(batファイルを作る等?)はありませんでしょうか。 参考となるサイト等でもわかればなんとかします。 どうかお願いいたします。

  • エクセル、ワードをPDFファイルにしたい

    複数ページ(Sheet)のエクセル、ワード(2010)をページを指定してPDFファイルにしたり、複数の別ファイルを一括でPDFにしたいのですが、簡単にできる方法があれば教えてください。 今は一旦PDFファイルにしてから、別のアプリで分割や統合しているのですが、頻度が増えてきて結構手間になってきましたので、何か簡単にできる方法があると助かります。

  • PDFから文字情報を抽出し、表に落とすには。

    請求書等、フォーマットが決まっている PDFから、情報を抽出して、 一覧表(Excel等)にするようなソフトウェアはないでしょうか? (※PDFの文字情報はテキスト化されています。)

  • 1つのセル内の文字数を削る

    エクセルの1つのセル内を80字以内に収めたいです。 既に完成しているファイルで80字を超えるセルが複数あり、 それらの文字数を80字以内に削りたいのですが、 方法はございますでしょうか。 宜しくお願い致します。

  • Excel VBAで複数のExcelブックからある文字列を検索→抽出したものをまとめたい

    Excel VBAで以下の操作は可能でしょうか。 私はAccessVBAを少しさわる程度でExcel VBAはまったくわかりませんし、 まだ現物データを見ていないので説明不足ですが、 ご存知の方がいらっしゃいましたらどうぞご回答をお願いします。 コード等もあわせて教えて下さるととても助かります。 複数のExcelブックからある文字列を検索→抽出したものをまとめたい。 ・検索抽出したい文字列の入っているセル位置は固定。 ・抽出したデータを新たなファイルにするか、どうするかはまだ未定。 ・Excelブックは100個ほどある。

  • エクセル 文字列抽出について質問です

    こんにちは^^ エクセル文字列抽出について質問です。 例えば、 "ボリュームサイズ=74.53GB" この文字列から、"="の前後に分けて "ボリュームサイズ" と "74.53GB" をそれぞれ別セルに抽出する場合、どんな方法があるでしょうか? 関数、VBAマクロどちらでも結構です。 教えて下さい。お願いします。

  • 特定の桁数を抽出

    教えてください。 エクセルのVBAで、 特定の桁数を抽出するにはどうすれば、よいでしょうか。 イメージは、添付ファイルのC列のようなVBAを作りたい、 と考えています。 条件としては、 (1)先頭~10桁までを抽出 (2)それ以降は削除 (3)文字列にする、 です。 使用ソフトは、EXCEL2010です。 よろしくお願いします。

  • エクセル オートフィルタ、文字色で抽出

    エクセル_2000なのですが、オートフィルタ等で、テキストの色が違う部分(たとえば、文字色「赤」のみ)抽出するような方法はありませんでしょうか。 VBAはあまりわかりませんので、アドインでそのようなものがあると有難いのですが・・。ご存知のかた、教えてくださいませ。

専門家に質問してみよう