• 締切済み

複数あるテキストボックス中のテキスト取り出し

microsoft officeのテキストボックスについてお尋ねします。windows xp SP3, office2007を使っています。複数あるテキストボックス内のテキストをすべて取り出してテキストファイルもしくはワードファイルを作りたいです。テキストボックスが大量にあるため、コピー&ペーストしていると非常に時間がかかります。良い方法をご存じの方がいらっしゃいましたら教えて頂きたく存じます。 ファイルをwebページとして保存してhtmlファイルをブラウザで開き、テキストファイルとして保存するとテキストボックス内を取り出せるという情報がありました。試してみたのですが、テキストボックス部分は画像になってしまい、テキストを取り出せません。どこかやり方がまずいのでしょうか。この方法も含め何か良い知恵がありましたらお貸しください。 テキストボックスについて質問させていただいていますが、最終的には通常のテキスト、オブジェクト上のテキスト(テキストボックスや図形上の文字)などファイル内にあるすべての文字をテキストファイルに落とし込みたいと思っています。なお、対象ファイルはエクセル、ワード、パワポと様々です。長くなって申し訳ありませんがよろしくお願いいたします。

みんなの回答

回答No.3

No.2の回答者です。 お礼への返答(補足)が遅くなりました。 Office2007で保存されたファイルにあるテキストボックスなどの オブジェクトはWebとして変換すると画像になるみたいですね。 関連した別質問に回答したほうでも同じ内容だったので。 http://okwave.jp/qa/q6805214.html 数日PCと離れていたので補足へのアドバイスが遅くなり、回答が 上記質問へとできなかったのですが、こちらは締め切っていない ので追加のアドバイスです。 上記質問でも解決方法はマクロ(VBA)にて対応しているように、 テキストボックスなどのオブジェクトから、テキストを抽出する ためにはWordやExcelごとにマクロを組んで、対応するしかない みたいです。 Excelなら上記質問のワークシートをテキストファイルに変更を することで対応できそうです。 Wordならこちら↓が参考になるかと。 http://www.nurs.or.jp/~ppoy/access/etc/etc026.html 私はVBAをアドバイスできるほどスキルがないので、これらでの 書き換え方法やAccessに対応したマクロを紹介できませんので、 別質問でOfficeの対象ファイルごとに違うことから別々の質問 としてアドバイスをもらったほうがよいかもしれませんね。 役にたたないアドバイスで申し訳ないです。 ちなみに、Officeファイルの形式を2007ではなく97‐2003形式 にしたもので試してみては。これをWebページとして保存をして 取り出せるか確認してみるのも一つの検証方法です。 この場合も、[ブラウザでプレビュー]を使って確認する方法も 検証してみてはいかが。ダメもとで検証するのも回答を待って いるだけでない対応方法ですので。 私が示した方法ならファイル形式は別にして、HTMLファイル として保存しなくても取得できる方法なので。

回答No.2

対象ファイルすべてでできるのか保証しませんが、以前のバージョンで テキストボックス内の文字をコピーしやすくする方法として、私がよく 使う方法を紹介しますね。Office2007以降のリボンがあるバージョン などを私は使っていませんので、検証はしていませんがあしからず。 以下の方法では、リボン内のコマンドとして初期状態では用意されては いませんので、Office2007はコマンドを[ユーザー設定]から追加する 必要があるようです。 http://juen-cs.dl.juen.ac.jp/html/office2003-2007/02/03/01/index.html http://juen-cs.dl.juen.ac.jp/html/office2003-2007/03/03/01/index.html http://juen-cs.dl.juen.ac.jp/html/office2003-2007/04/03/01/index.html [ブラウザでプレビュー]コマンドを、[クイックアクセスツールバー] に登録しておきます http://www.becoolusers.com/office/quick-access.html 使用しているブラウザ上に、テキストボックスを含むレイアウトでの 表示がされ、そのテキストをコピーできる状態になります。 [テキストボックス]の順番(関連するセルや段落などとの位置)での コピーをすると、関連した選択順になるのでテキストファイルとして メモ帳などに貼り付けします。 簡単なファイルで試してみて、問題がなければ大量にあるテキストで 実施してみてください。 この方法なら、ファイル自体に影響せず、保存できると思います。

yusukoi
質問者

お礼

ご回答 有難うございます。ご教示のとおりやってみたのですが、テキスト含めて画像になってしまうようです。テキスト自体が選択できる状態にならず、テキストボックスごとテキストファイルに貼り付けるとbitmapと表示されてしまいます。office2007では変わっているのかもしれません。詳しいご回答を有難うございました。

  • keithin
  • ベストアンサー率66% (5278/7940)
回答No.1

幾つか手はあると思いますが,PDFに保存し直してAdobe Reader画面上でテキストを選択コピーしてしまうのが,どのソフトからも同じ段取りに集約できて結局一番手間要らずかなと思われます。 PDF化ソフト(Acrobatなど)をお持ちならそれをご利用いただければ良いですし,マイクロソフトからもフリーで入手できます。 http://www.microsoft.com/downloads/ja-jp/details.aspx?FamilyID=4d951911-3e7e-4ae6-b059-a2e79ed87041 使用方法も説明されていますので,確認してご利用下さい。

yusukoi
質問者

補足

ご回答有難うございます。実はご指摘いただいた方法も試してはいるのです。しかしテキストボックスや表などがたくさん入った複雑な資料になりますとPDFからコピーした時点で文字の配置が崩れたり欠けが生じたりするため、元のテキストが正確に拾われているかの確認作業をするのに難儀しております。

関連するQ&A

  • office word 2007のテキストボックス

    Microsoft office word 2007のテキストボックス Word文書上にオブジェクトとしてテキストボックスを張り付けたのですが、そのテキストボックスがWordに打った文書(本文テキスト)と重なってしまいました。このテキストボックスを移動させたいのですが、テキストボックスを認識させることができません。文書(本文テキスト)を改行すると、このボックスもそれについて行きます。。。 くわしいかたおしえてください。

  • ワードの「テキストボックス」と写真・図形

    ワードの文書の中で「jpeg形式で保存した写真とか図形の画像ファイル」を扱う場合の方法として、 (1)「jpeg形式で保存した写真とか図形の画像ファイル」をコピーしてワードの文書の中に貼り付ける方法と、 (2)予めワード文書の中にテキストボックスを挿入しておいて、そのテキストボックスの中に「jpeg形式で保存した写真とか図形の画像ファイル」のコピーを貼り付けるか、又はそのテキストボックスの中に「jpeg形式で保存した写真とか図形の画像ファイル」を挿入する方法と、 の2つの方法があると思います。 いずれの方法でも、文字の回り込み、画像の縮小拡大、画像の移動などは可能です。 (2)は、多くの人は使わないと思いますが、私は、何故か、今まで、結構、使っていました。(2)の方法の場合、テキストボックスの外枠は、消すようにします。 確かに、(2)の方法では、テキストボックスを挿入したり、テキストボックスの外枠を消す手間が発生するので、煩雑になります。 (1)の方法の方が煩雑ではなく良いのかもしれませんが、私は、なんとなく、煩雑ですが(2)の方法による方が安心感があります。 (1)の方法よりも(2)の方法の方が優れている部分はあるでしょうか?

  • PowerPointテキストボックスで右端の文字が消えてしまいます

    PowerPointによる資料作成でファイルを閉じて,開きなおすとテキストボックスに入力した文字の内の右端の1文字が消えてしまいます. オブジェクトの書式設定で表示される下記3項目は空です.  描画オブジェクト内でテキストを折り返す  テキストに合わせて描画オブジェクトのサイズを変更する  描画オブジェクト内でテキストを縦書きにする 当初,2項目目のサイズ変更が可能となっていたのでチェックをはずしましたが保存後にファイルを開きなおすと右端が消えていました.このまま印刷してみたところ,消えた文字は印刷されない状態でした. ファイルを開くたびに文字が消えていないかをチェックしてから印刷するのは大変なのでファイルの保存に関係なく,文字が消えないテキストボックスの設定を行いたいのですが,他に注意するポイントが思いつきません.どうかアドバイスを頂けますようお願いします. なお,ソフトのバージョンは以下の通りです. Microsoft Office PowerPoint 2003(11.8227.8221) SP3 よろしくお願い致します. m(_ _)m

  • Word2003で新規テキストボックス作成時に他のテキストボックスの中身がコピーされる

    Win XP、Office2003を使っています。 Word文書内で図形描画ツールバーのテキストボックスボタンから新規にテキストボックスを作成すると、中に同じ文書内の他の場所のテキストボックスの中身がコピーされた状態で作成されます。 この新規テキストボックス内の文字を削除すると、コピー元(?)であるテキストボックス内の文字も同時に消えてしまいます。 この新規テキストボックスをまるごと削除すると、コピー元(?)であるテキストボックスも削除されます。そして、コピー元(?)であるテキストボックスが削除された跡地には空白のテキストボックスが残され、(図形描画ツールバーのオブジェクトの選択ボタンで探すと発見できる)しかもその空白のテキストボックスは中身の編集ができません。 普通に新規のテキストボックスを作成するにはどうしたらいいでしょうか。 報告書の提出が迫っていて困っています。

  • 図形とテキストボックスの全部を簡単に選択したい

    Word 2010で、描画キャンバス内にたくさんの図形とたくさんのテキストボックスとがあるとき、その全部を選択してグループ化するときに、図形とテキストボックスの数が多いと、1個ずつ選択していくと全部選択するのが手間です。 「オブジェクトの選択」で範囲指定すると、図形は全部選択できますがテキストボックスが全く選択されません。 たくさんの図形とテキストボックスの全部を簡単に選択する方法があるでしょうか。

  • テキストボックスで段組したい

    wordで簡単な「地域たより」を発行しています。 ワードにまず「オブジェクト枠」を入れ、オートシェイブやテキストBOX を配置していますが、そのテキストBOX に通信記事を入れたいのですが、このテキストBOX では、段組できないのでしょうか? 出来ないなら、新聞のようなレイアウトの方法があれば、お教えください。 現在XP で 「Office2003」を使用しています。

  • テキストボックスって関数?

    エクセルです。 シートにテキストボックスを置くと、数式バーに a=EMBED("Forms.TextBox.1","") が表示されるのですが、テキストボックスって関数なのでしょうか? 「EMBED」について http://office.microsoft.com/ja-jp/word-help/HP005186147.aspx を読んだのですが、良くわかりませんでした。 「ほかのアプリケーションで作成されたオブジェクトを挿入します。」 と書かれてますが、 テキストボックスは「ほかのアプリケーション」ではないですよね。 それともテキストボックスはアクティブエックスコントロールだから ほかのアプリケーションになるのでしょうか?

  • テキストボックスの内容が複数消えていた

    windows7 ワード2010 でテキストボックスを多用しておりますが、購入当初 からテキストボックス内の文字データがすべて消去してしまう現象に困っております。時には画像枠内の画像も消えていました。 空っぽのボックスは残っています。1文書内の複数(時には40、50個のときもあり)の文字データがどの時点で消えてしまったのかは不明です。 複数ボックスが一度に消えてしまうなんて 不思議な現象です。マイクロソフトのサポートに何度も質問しているのですが、一向に解決されません。作業するたびに時間差でファイル名を変更して保存したり、苦肉の策を使ってもみるのですが、仕事に使うとなるとえらい作業になります。 ちなみにマシンはソニーのバイオです。昨年8月 購入時点にオフィスがセットアップされていたものです。 どなたか、同じような現象はおきていないでしょうか?

  • ワード2007図形内のテキストボックスの文字の縮小

    Word2007.2010でグループ化した地図を縮小する際テキストボックス内の文字も一緒に縮小させる方法を教えてください。 地図を作成する際  図形を描きテキストの追加などで図形内に文字を書き、全体をグループ化し縮小しようとすると、 図形の部分は縮小されますが、文字のサイズは変更されません。 図形とともに文字も縮小される方法はありませんか。教えください。 一度ペイントでJPEGなどで保存し図として挿入すればできますが。Word上ではできないのでしょうか

  • ワードでテキストボックスの印刷ができなくなった

    WindowsXPでMicrosoft Office Word2003を使用しています。本日突然午後からワードのテキストボックスの印刷ができなくなりました。ボックスを使用せず、通常の文章は印刷できます。このテキストボックスはテンプレートで10種類ほどあります。全く新しく別のファイルでボックスを作成して試してみましたがやはりうまくいきません。どうしたらリカバリーできるのか教えて下さい。

専門家に質問してみよう