• ベストアンサー

Word文書から特定の文字を抜き出すには

Wordの文書内の指定した記号で囲まれた文字、 (例えば、"「"と"」"を指定すると、文書内の「」で囲まれた文字) を全部抜き出して、Excel上に出力したいのですがどうしたらいいのでしょうか? フォルダを指定して、そのフォルダに入ったWord文書を全て検索する。 指定する記号は、「」、【】、『』など5種類ほど、指定する。 このようなことがしたいのですが、書籍などの情報がなくて困っています。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Zz_zZ
  • ベストアンサー率44% (756/1695)
回答No.2

マクロを組めば出来そうですが、文書を1つづつ開かなけ ればならない可能性も有るかもしれません。(良く知りま せん。) ANo.#1 と比べて、帯に短し襷に長し的な方法ですが、ディ レクトリ内文書を全部検索して、その結果をリスト出力で きるようです。 KWIC Centre 2.27 http://plaza3.mbn.or.jp/~h_ishida/KWIC.html  フリー :テキスト検索のみ  シェアー:PDF/WORD/EXCEL等の GREP 検索、\1,000)  ・ファイル検索    正規表現に対応(jre32.dll を使用、DL 可)  ・リスト    検索結果をリスト形式、タブ区切りデータで出力可能。 検索語を、正規表現で指定。例えば、 「.*」.*『.*』.*【.*】 (.* は、正規表現での、いわば、ワイルドカードの指定方 法です。) として検索し、検索結果のテキスト出力(行単位)をし、更 にこれを perl や sed で加工すれば、検索語だけを csv 形式などに出来ます。 テキスト検索機能のみはフリーですので、まず、テキスト ファイルで(.doc から .txt に落として)試して見ても良い と思います。 作者に、検索語だけの出力オプションを依頼する方法もあり ます。

参考URL:
http://plaza3.mbn.or.jp/~h_ishida/KWIC.html
malco-mama
質問者

お礼

こんばんは、ご回答ありがとうございました フリーソフトを早速インストールしました。 最初漢字二字の言葉を検索してみて、スムーズにいき、 CSVファイルに出力して感動していたのですが、 その後、引き続き試そうとすると「サービスが実行中ではありません。」 というメッセージがでて、検索を受け付けてくれなくなりました。 アプリケーションを起動しなおしても同じ状態です。 何故か、もしご存知でしたら教えていただけないでしょうか? よろしくお願いします。

その他の回答 (4)

noname#2567
noname#2567
回答No.5

 Officeの中だけで処理するなら、VBAプログラム(Officeのマクロ)を作らなければなりませんね。  Wordで元文書を開いた状態でマクロを起動。  マクロからExcelのオブジェクトを取得して置いて、「」、【】、『』等の並びにマッチングする部分を検索。  検索は、WindowsのRegExpオブジェクトを利用すると簡単に書けると思います。  一つマッチングする度に、マッチした範囲をExcelのセルに複写、次にマッチする箇所を検索・・・これを最後まで繰り返し。  終わったら、ExcelのWorkBookに名前をつけて保存・・・。  こんな感じですかね?  実際にコードを組むにはそれなりに手間なんで、やってはいませんが。(^^;  VBAに関するリファレンスは、各OfficeアプリケーションからVBAエディタを起動し、ヘルプを参照すればそれなりに詳しく書かれていますよ。  MSの各種言語に関する詳細な情報は、MSDN Onlineを参照してみて下さい。  MSがリリースしているありとあらゆる言語やOSの詳細な情報を読む事ができます。 (下のURLは日本語サイトなので、日本語に翻訳されている情報のみです。  英語サイトならば、全ての情報が英語で読めます。)

参考URL:
http://www.asia.microsoft.com/japan/msdn/default.asp
malco-mama
質問者

お礼

こんばんは、ご回答ありがとうございます。VBAだけでもできるのですね。 私はまだVBAの初心者なので、書籍等のサンプルを組み合わせて何とか必要な機能を実現している段階です。 Excel、Accessはいろいろと覚えてきましたが、そのほかのことはあまりわかりません。 今回はWordに関することなので、早速書店にいってみたのですが、WordVBAに関する本は1冊もなくあきらめていました。 VBAで実現できることがわかったので、ヘルプなどでもっと調べてみようと思います。

noname#8602
noname#8602
回答No.4

私も、こういった作業は、テキストに落とし、awkやperlで処理する作業だと思います。 Zz_zZさんが例示されたような正規表現を使い、*.txtを入力ファイルにすれば、それこそ、一網打尽のレベルでしょう。 おそらく、「1行野郎」に毛が生えた程度のスクリプトで、CSVまで持っていけると思います。

参考URL:
http://www.fukumi.co.jp/mm/pc/link_scr.htm
malco-mama
質問者

お礼

こんばんは、ご回答ありがとうございました。 恥ずかしながら、「perlって言葉は知っているけど何?」という状態で早速書店で本を買ってきました。 今から読むところです。 今回の仕事に役に立つか(間に合うか)わかりなせんが、今後の課題として取り組みたいと思います。

  • Zz_zZ
  • ベストアンサー率44% (756/1695)
回答No.3

ここなどは参考になるでしょうか?

参考URL:
http://search.download.yahoo.co.jp/bin/v_searchf?p=word+%8C%9F%8D%F5
malco-mama
質問者

お礼

ご紹介いただいたソフトKWICの件で、なかなかうまくいかなかったのですが、 教えてくださったURLのサポート掲示板に投稿することにより解決しました。 本当にありがとうございました。

  • shota_TK
  • ベストアンサー率43% (967/2200)
回答No.1

一網打尽に移動することはできないと思いますが,ひとつずつ拾うのは簡単です. 「編集→検索」で検索オプションを表示させ,「ワイルドカードを使用する」にチェックを入れます.そして,例えば【】で囲まれた文字列を検索したければ,「検索する文字列のところに【*】と記入します.半角のアスタリスクです.これは,トランプで言えばジョーカーの役割をしますので,【】で囲まれた文字列が全て検索されます. あとは,面倒ですけど,見つけ次第,一度本文に戻ってカット(コピーではなく)し,Ctrl+Endで文末に移動しペーストします.再び検索ウィンドウをクリックして次を検索すれば,割と簡単に【】の文字列を集められると思います.

malco-mama
質問者

お礼

shota_TKさん、早速のご回答ありがとうございました。 大量に文書があるので、VBAの自動処理を想定していたのですが、 やはり一つ一つ検索するしかないのですね。とても残念ですが、地道に頑張ります。

関連するQ&A

  • ワードの文書の文字化けをなくすには。

    windows vistaでword2000をずっと使っています。3日前、なにかの拍子「このファイルは開けません」とでたので、「プログラムの一覧から選択する」で、ワードパッドを指定しました。そのためか、すべての文書が文字化けしてしまいます。その後、ワードビューアーをダウンロードして、削除しました。 なにが原因なのかわかりませんが、大事な文書がすべて使えなくて、困っています。どうすればいいのか、お教えてください。

  • ワードで新文書に既存の文字が入ってる

    ど素人ですみません。 お助けください。 ワードを開くと、新しい文書のはずなのに、すでに文字が入っています。それは以前に作成した文書なのですが、どうやっても消せません。 文書自体は消せるのですが、新文書を開くとまたその文字はでてきます。 テンプレートではなく、新しい文書作成ででドキュメントを指定しても、こうなります。 困っています。 どうやって消せばいいのでしょう。

  • ワードの文書が文字化けして困ってます

    ワードの文書が文字化けして困ってます。 自分が以前作ったhtml形式のファイルがありますが、 そのファイルをワードで開くとなぜかすべて文字化けしてしまいます。 その反面、そのファイルをウェブで見るとなぜ化文字化けせずにまともに見られます。なぜそうなっているのか良くわかりません。 文字化けしないようにするにはどうしたら良いでしょうか? よろしくおねがいします。

  • ワード文書セーブ後、突然、文字化け

    ワード文書をセーブして、次に開いた時、突然、文字化けしていました。 セーブ時にも、オープン時にも、エラーは出てませんでした。 全ての文書が文字化けしたわけでなく、1000ページ位あるうち、8割程度、全くわからない漢字や記号の羅列に変わりました。 ファイルは、1.6Mb位です。 ファイルが大きすぎたのでしょうか? 復活させる方法はないのでしょうか?

  • ExcelでVBAでWordの文字列一括検索

    ExcelでVBAでWordの文字列一括検索したいのですが、作成方法が 全くわかりません。 内容としては、フォルダ内の複数のWord文章の文字列を検索し、 検索結果をExcelのシートに落としたいんです。 検索内容としては、「Word文書ファイル名」、「ページ」、「行数」 がわかればOKなのですが…。 仕事で使うため急ぎなのですが、何かいい情報があれば教えてくだ さい。

  • WORD文書の行末を全て自動的に改行する方法

    WORD文書を開いてEXCELにコピーして利用する場合、WORD文書としては標準の文字数で行替えされている文章が、改行記号のある段落単位でEXCELの1セルに入力されてしまいます。 例えばWORD文書で1段落150字の文章が40字で行替えされていると4行になり、4行目に改行記号が入っているとします。これをコピーしてEXCEL文書に貼り付けると1セルに4行分のデータが入ってしまいます。セルを連結したりセル内で折り返しを使わずにWORD文書の見かけのレイアウトをそのまま保持したい。 EXCELにcopy&pasteしてWORD文書と同様のレイアウトを保持するには次の方法が良いと思いますが、方法が不明です。何方かわかる方教えてください。 ・WORD文書の行末を全て自動的に改行した上でEXCELにcopy&pasteする

  • Word文書の改行を無くしたい!(

    かなり長いワードの文書を印刷したいところですが、 この文書はoutlook expressのメールからwordに移しまとめたものです。 不必要な改行が多すぎて、このまま印刷掛けると、 余計沢山の枚数が掛かってしまいます(A4紙100枚位)。 (注:改行のように見えますが、でも毎行最後の文字の後ろに出るのは、普通の改行マークではなく、↓のマークです。) 改行現象さえ無くせば、枚数は半分位圧縮できそうです。 手動で1行ずつ後ろの空スペースをDelateしていくのは、大変時間掛かりますので、 ※ 置換 → 検索する文字列に^pを入力 → 置換え後の文字列には何も入力しない。 こういうふうに操作して見ましたが、「0個の検索項目がありました」との結果が出ました。 選択範囲を指定してやるようにも試みましたが、やはり同じ結果でした。 こういう情況ですので、何か処理法がありますでしょうか。 文書は全部繋がっていて読みにくくなっても構いませんから、 ご指導宜しくお願い致します。

  • ■Wordの文書が消えた。

    保存してあったWordの文書の中身が表示されません。          (同じフォルダー内の何個かが) ・Wordのアイコンの後の、タイトル名もサイズも表示されています。 ・これをクリックして開くと白紙で新規の状態で表示されます。 ・もし、誤って消したのならサイズが減っていないのはおかしいと思いますが。 ・同じフォルダーに保存されている別のWordの文書は正常に見られるものもあります。(ほぼ同じ頃に作成しました) ・読み取り専用などの設定はしていません。 ・他のパソコン操作(別ソフトなど)での異常はありません。 ・同じフォルダー内に新規の文書を作ると、正常に保存と表示がされます。 ・ウイルスで復元したことはあります。が、それが原因ならフォルダー内の全てのWordの文書が同じになってもいいと思うのですが・・・・ 宜しくお願いします。

  • ワード文書の文字訂正

    1.マイドキュメント の中に保管してある各種文書の文字訂正が、突然ワンテンポ遅れて表示されるようになりました。 2.具体的には、保存してある文章の中の誤った文字・数字・記号を消して、正しい文字・数字・記号を入力する操作をしますと、従来は直ちにその場で正しい表示に切り替わりましたが、本日、突然、次のようになってしまいました。フォルダーのタイトル表示も同様です。 3.即ち、誤った文字を消して、正しい文字を入力する操作をしても、その時点では画面上の表示が変わらず、一旦当該文書全体の表示を消して、再表示すると 訂正箇所が正しく表示されるようになってしまいました。 4.何か誤ったキーを押してしまったのでしょうか。元に戻す方法を教えて下さい。 SS生

  • word起動時の"文書1"について

    Windows2000、Word2000です。 WORD起動時に開く文書に“あkdfjぢが・・・"みたいな文字がすでに入力されていて真っ白の文書が立ち上がりません。 Normal.dotが書き換えられていると思い、コンピュータ内を検索してみましたが、Normal.dotの文書が見つかりません。Templateフォルダの中をくまなく見てみましたがNormal.dotにあたる文書がなんなのかよくわからず、、、、 Word起動時に開く"文書1"ってNormal.dot以外何かあるのでしょうか? 要は、新規文書を開いたときに真っ白な文書であったらよいので、そうする何か良い方法をご教示ください。

専門家に質問してみよう