• ベストアンサー

ExcelデータからPDF内を検索する方法

ExcelのA列に人名が10000行程度入っています。 300頁程度の横書き文章のPDFファイルがあります。 このPDFファイル内をExcelのA列の人名で検索して,1件以上ヒットする場合に○,1件もヒットしない場合に×をExcelのB列に返すようにしたいです。 このようなことは可能でしょうか。 可能な場合,必要な条件(ソフト等)と,やり方を教えていただけますようお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • skp026
  • ベストアンサー率45% (1011/2238)
回答No.2

みっつほどご紹介します。 1 Acrobat Readerではなく pdfの開発や作成の環境の、Acrobatをお持ちなら http://pdf-file.nnn2.com/?p=239 2 無い場合 https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1410306084 (1)のような、コンポーネントを使っておらず、 外部のコマンドを使ってます。 多少やぼったいです。 3 Word2013は読み込みできるようです https://inouetetsurou.wordpress.com/2013/07/28/officeワード2013のpdf文書読み込み機能を使ってみ/ ※すみません。URLはコピペして下さい。 以下はExcel VBAでWordを使う例 http://www.atmarkit.co.jp/ait/articles/1512/17/news020.html ※ いずれも外部アプリの利用となります。 遅かったり、メモリを消費することが考えられますので、 環境や使い方に注意が必要だと思います。 ユーザーにpdfのテキストをコピペしてもらうなど、 別の方法も検討しておくと良いかもしれないです。

chamuji_vv
質問者

お礼

回答ありがとうございます。 ひとまず2の方法を試してみます。

chamuji_vv
質問者

補足

上記2の方法にあるxdoc2txtを試したところ,無事PDFファイルからテキストデータを抽出してExcelに貼り付けることが出来ました。一部姓名の間に文字化けのような記号が挿入されてしまいましたが,9割ほどの文章は利用できそうな形で抽出できました。上記ソフトを使わずにふつうにPDFリーダーを開いた状態から全選択でコピペをすると改行で人名が分かれてしまった場合に検索ができなくなっていたので,一歩前身です。今回は時間が限られているのでこれで作業をしようと思います。ありがとうございました。

その他の回答 (1)

  • aokii
  • ベストアンサー率23% (5210/22062)
回答No.1

マクロ以外では通常不可能です。 できれば、PDFファイルをテキストでエクセルに変換してみて下さい。 試しに、例えば、以下のサイトで、PDFファイルをエクセルに変換してみて下さい。 https://smallpdf.com/jp/pdf-to-excel

chamuji_vv
質問者

お礼

回答ありがとうございました。またよろしくお願いします。

chamuji_vv
質問者

補足

回答ありがとうございます。 上記サイトを使ってPDFファイルをExcelに変換したところ,数百シートに分割されてしまいました。 countif関数は複数シートを串刺し検索することが出来ないようなので,作製された複数のシートを手軽に1つのシートにまとめることが出来れば良いのですが…

関連するQ&A

  • エクセルVBAでPDFを1枚目のみ大量に印刷したい

    エクセルVBAでPDFを大量に印刷したい PDFファイルが6000件くらいあって Aというホルダーに1.pdf,2.pdf ・・・6000.pdfといった形で保存しております エクセルのA列に必要な番号を入力し50~60件印刷します A列には必要なファイル番号のみ入れていきます 2,3,6,100,210といった形でA列に必要なデータを入れて VBAで起動させるとA1から順番にアクティブプリンターで印刷したいと おもっています。 どのようなVBAにすればいいのかわかりません。 ループで繰り返しになる感じになると思います N=N+1といった感じでA1セル.PDF 印刷 A2セル.PDF           印刷 A3セル.PDF           印刷 といった形でAに入る数字は毎回違ってきます 番号はあるけどファイルがない場合はその番号を B1列から順番に摘出するようなものを考えてます 印刷については、全部1ページのみ印刷をします。1PDFで4ページあっても先頭の1ページのみ印刷です。 どなたかお忙しいとは思いますがご教示いただけませんか よろしくお願いいたします

  • excelとpdfについてです

    書類を個人別にpdfファイルにして(社員番号.pdf)と名前を付けました。 エクセルで社員番号の表があるんですが 例えばA列に社員番号が並んでいる表の 番号それぞれにリンクする簡単な方法はありませんか? 一つずつやるしかないのでしょうか? 全部で1500件ほどなので二の足を踏んでいます 宜しくお願いします

  • エクセルVBAでPDFを大量に印刷したい

    PDFファイルが6000件くらいあって Aというホルダーに1.pdf,2.pdf といった形で保存しております エクセルのA列に必要な番号を入力し50~60件印刷します A列には必要なファイル番号のみ入れていきます 2,3,6,100,210といった形でA列に必要なデータを入れて VBAで起動させるとA1から順番にアクティブプリンターで印刷したいと おもっています。 どのようなVBAにすればいいのかわかりません。 ループで繰り返しになる感じになると思います N=N+1といった感じでA1セル.PDF 印刷 A2セル.PDF           印刷 A3セル.PDF           印刷 といった形でAに入る数字は毎回違ってきます 番号はあるけどファイルがない場合はその番号を B1列から順番に摘出するようなものを考えてます どなたかお忙しいとは思いますがご教示いただけませんか よろしくお願いいたします

  • 1つのPDFファイルを違う名前で大量保存

    1つのPDFファイルをエクセルのリストに基づき 管理NOをつけて名前をつけて保存をしたいのですが エクセルのマクロでできますでしょうか。 A.pdf→管理Noつきの11111_A.pdf、22222_A.pdfのように複数作成 PDFのファイル名に関しては エクセルのA列に下記のように記載 A列 ファイル名(1行目は見出し行) 11111_A.pdf 22222_A.pdf ↓ リストは250行ほどあり、1つのA.pdfを指定したフォルダに別名で250個保存したい。 マクロは超初心者で、指定したPDFファイルを開くことはできたのですが エクセルのリストに基づいてPDFファイルの保存ができませんでした。 どなたか教えていただけると嬉しいです。

  • エクセルをPDFファイルにするには?

    Microsoft2013 excel2013で データを作りました。 ファイルをクリックして、エクスポートをクリックして PDF/XPSドキュメントの作成をクリックして、 pdfファイルを作成したのですが、 エクセルの列が半分、分かれてしまいます。どうしたら良いのでしょうか? つまり表が縦で二分して、次のページにその表の右側がでてくるので、行でのつながりがわからなくなってしまうのです。 よろしくお願いいたします。 パソコンは windows10です。

  • PDFとエクセルシートを連続印刷する方法

    エクセルVBAを利用して、PDFとエクセルファイル(シート名指定あり)の混載するリストを参照し、 連続印刷する方法を教えてください。 印刷リストとして、 A列にファイルタイプ(xlsかPDFか) B列にファイル場所 C列にファイル名 D列にシート名 E列にする/しないの印刷フラグ を記し、 PDFの場合はファイル場所とファイル名を参照して印刷、 xlsの場合はシート名まで指定して印刷するという処理を書きたいのです。 添付の画像を参照すると、印刷するのは E:\test\111.pdf E:\test\222.pdf E:\test\222.pdf E:\test\Book1.xlsのSheet1 ・ ・ ・ となります。 A列に「判別」としたのは、PDFかエクセルかを見分けるのに必要かなと思って設けました。 リストはイメージなので、必要であれば編集しできます。 全てのファイルをPDFにしてしまえば良いのですが、 それは理由があってできないのです。 VBA初心者で、エクセル2010を使用しています。 どなたかご存じでしたら、ぜひお教え下さい。 よろしくお願いします。

  • エクセルである文字を検索させてヒットしたものを行ごと消去する方法

    現在エクセル2000を使っています。 そこにデータがあるのですが A列・B列・C列・D列・E列・F列 までをつかって作ってあります。 文字を検索してその文字がヒットする 行ごとを消去する場合はどのようにすれば よろしいでしょうか? どの列でも、その文字が入っている場合は 行ごと消したいのですが。 そして、その行は空白になるのではなく 詰めたいのです。 例えば 111111111 222222222 333333333 となっているデータで2を消すとして 111111111 333333333 となるのではなく 111111111 333333333 とゆうように詰めて作りたいのです。 すみませんが、よろしくお願いします。

  • アドベのPDFのデータをエクセルに変換したい。

    アドベのPDFで作られているデータをエクセルに変換して使いたいのです。元のデータは、表の形式になっており、セル内の文字は、データとしてPDFには組み込まれています。ですから、コピー&ペーストで、データとして認識させて、一部をエクセルに移すことは可能です。しかし、表全体をエクセルに移そうとすると、行や列が整列せず、ぐちゃぐちゃなデータになってしまいます。せめて、1列ずつでも認識できれば作業は楽になるのですが、1行ずつは可能でも、1列ずつは、私には無理でした。 このような場合、アドベのアクロバット7などの編集できるものを使うと、これらのデータを編集しなおして、エクセルに変換したりできますか?たとえば、表のうち1列を空白セルにしたり、特定の文字に入れ替えたりできますか?もしできれば、試行錯誤して、エクセルの表に直すことは可能だと思うのです。

  • Excel データの抽出について教えて下さい。

    初めて質問させて頂きます。 Excelでデータの抽出と言ったらいいでしょうか・・・ 「一定の条件に当てはまった場合に、別のセルに数字を入力する」 というような処理をしたいのですが、データ量が多くて、 どのようにやったら効率がいいのか、頭を悩ませています。 例えば・・・       A列  B列 1行目  111   A 2行目  112   B 3行目  115   C 4行目  115   C 5行目  118   D といったようなデータが1500件ほどあります。 このデータを使って、A列の中で番号が2つ(又は3つ等)あるものに、      A列   B列  C列 1行目  111   A 2行目  112   B 3行目  115   C    1 4行目  115   C    1 5行目  118   D といった感じで決まった数字を表示する方法がないでしょうか? こんな説明でご理解頂けるかどうか、心配なんですが・・・。 いい方法をご存知の方がいらっしゃいましたら、力を貸して下さい。

  • PDFをfirefoxで開くと検索が不能

    winはxpです。 最近PDF file をfirefox27.01で開いた場合の 検索がほとんど出来ません。 検索KWはfirefox画面の左下隅の小さな一行窓に入ります。 googleでhitして出たlistにある数行の文字列の中に 存在しているにもかかわらず「みつかりませんでした」です。

専門家に質問してみよう