• 締切済み

テキストのコピペについて

お世話になります。 以下の内容で困っております。どなたかご教授お願い致します。 ●PDFに膨大なページの文章が元データとして存在しており、それらのテキストデータを一点一点項目ごとにエクセルのセルへコピーしています。 PDFからエクセルのセルへコピーすると、表示されない文字があります。たとえば、半角(-)や半角(/)など、エクセル上で文字コードを一個一個調べて、置換しようと思ったのですが、置換の必要のない半角(スペース)までもが置換されてしまいます。 エクセル上で調べるとCODE(32)で半角(-)や半角(スペース)となっています。 このような置換をする場合は、正規表現の可能なテキストエディターで 置換するしかないでしょうか?

みんなの回答

  • assault852
  • ベストアンサー率48% (1364/2797)
回答No.1

>正規表現の可能なテキストエディターで置換するしかないでしょうか その通りですね。

ruko3ruko2
質問者

お礼

ありがとうございました。 結局作業時間の都合で、DBにデータを落としてから、エディターで再編集することにしました。

関連するQ&A

  • テキストエディタでの置換(正規表現チェック済)と同様のことを

    テキストエディタでの置換(正規表現チェック済)と同様のことを エクセルのマクロでもしたい。 画像を添付しましたが、秀丸で置換を選択し、 検索文字列と置換文字列を入れて、正規表現チェックのチェックボックスを 選択した状態で実行するのと同様のことをエクセルのマクロで行いたいです。 正規表現混みだととても難しいです。 やりたいことはマクロで、フォルダ内のテキストファイルを置換をかけていきたいです。(テキストファイルは複数ある状態)そのテキストファイルを更新できればいいです。(別テキストで出力されてもいいです。) どなたか詳しい方、教えていただけませんでしょうか? よろしくお願いいたします。 --- 検索エディタ【秀丸】【置換】 検索【.*item1=(.*) item2=(.*) .*】 置換【\1\t\2】 正規表現チェック

  • AdobeReaderXにおけるテキストのコピペ

    Adobe Reader Xにおけるテキストの選択及びコピーについてアドバイスください。 Adobe Reader Xで開いたファイルのテキストをコピーしたいのですが、 「テキスト選択ツール」をクリックしても文字選択できない状態です。 ポインタが+形のままで、 I 形アイコンに変わりません。 調べたところ、PDFファイルがテキストのコピーを許可しない設定の可能性があるということで 「文書のプロパティ」―「セキュリティー」より確認したのですが   ・セキュリティ方法:セキュリティなし ・文書に関する制限の概要:内容のコピー⇒許可 / ページの抽出⇒許可               となっています。ファイルは自身でスキャナーをとったもので作成者は私になると思うのですが、 一体何がいけないのでしょうか。 画像としてのコピペはできますが、貼り付けた形式での提出がNGなので困っています。 元々のファイルは前任が破棄しており、紙ベースでしかデータが残っておらず PDFからエクセルへなんとか貼り付けできないものかと苦戦している次第です。 ちなみに「Freeware PDF Unlocker」も用いてみましたが文字の選択はできませんでした。

  • エクセルの1セルを1文字でテキストにする方法

    エクセルで編集したものをノートパッドに貼り付けた時に、どうしても余分なスペースが取り込まれてしまい困っています。 エクセルには1セルに対し半角英数を一文字ずつ入力しており、空白セルも存在させています。 これをノートパッドに貼り付けして、textとして使用したいのですが、余分なスペースが入ってしまいます。 また、エクセルの名前をつけて保存でも同じくスペースが入ってしまいました。 エクセルで空白セルにしているところは半角のスペースとして使用したいので、置換も使えません。 どのようにしたらエクセルからテキストにうまく変換できますか? よろしくお願い致します。

  • 複数行のテキスト置換

    エディタを用いて複数行にまたがるテキストの置換。 下記のようなテキストがあり あああああああああああああああ いいいいい■■■■■いいいいい ううううう■■■■■ううううう えええええ■■■■■えええええ おおおおおおおおおおおおおおお      ■■■■■      ■■■■■      ■■■■■ の部分を      ●●●●●      ●●●●●      ●●●●● に置換したいです。 ただ■を●にしたいのではなく、 ■15文字を検索して ●15文字に置換したいです。 正規表現を考えたんですが思いつきませんでした。 あああああああああああああああ いいいいい■■■■■いいいいい うううう■■■■■うううううう ええええええ■■■■■ええええ おおおおおおおおおおおおおおお このような感じもヒットしそうで・・・ 列も見て検索するといいますか そのようなツール・ソフト・やり方等ございましたら ご教授よろしくお願い致します。

  • 正規表現を教えて下さい(テキストエディタでの置換)

    いつもお世話になっております。 正規表現に関して細かい質問をさせて下さい。 例えば、G-01,T-02,F-05とあったときに、 これを、01,02,05としたいとき、 正規表現の置換で「[A-Z]-[0-9][0-9]」→「[0-9][0-9]」とすると、 "[0-9][0-9]"という文字列だけ残ってしまいます。 既存の文字列をそのまま残すにはどのようにしたらよいでしょうか? ※テキストエディタでの置換に関してです。 宜しくお願い致します。

    • ベストアンサー
    • PHP
  • EXCELの文字列を貼付けた時の「"」をなくしたい

    EXCELのセルに複数行の文字列が入っています。 このセルを選択して、Ctrl+Cでコピーしました。 次に「メモ帳」などのテキストエディタを開き、Ctrl+Vで貼り付けました。 すると、先頭と最後に「"」が付加されてしまいます。 この「"」をなくすにはどうすればよいかアドバイスをいただけないでしょうか? なお、実際はテキストエディタではなく、Webページのフォームに入力するため、文字列の置換はできません。 よろしくお願いいたします。

  • Excel2007テキストボックスにコピペ→白色字

    Excel2007で文字をコピーしてテキストボックス内に貼り付けをすると、 コピーした文字が白色の文字になってしまいます。 テキストボックスに設定した色で貼り付け可能な方法をご存知でしたら教えてください。 Excelシートのセル、もしくは同テキストボックス内からデータをコピーして貼り付けた際に 文字が白色になってしまいます。 他のアプリケーション(メモ帳)などからコピーした場合は文字色が黒で表示されます。 テキストボックスそのものはデフォルトの設定になっていて、文字色も「自動(黒)」にしてあります。 貼り付けのたびにフォントの設定をしなければならず、手間がかかってしまうので、 設定をしなくても黒色で貼り付けられるようにしたいと考えています。 対処方法をご存知でしたら教えてください。

  • テキストの半角文字を全部削除したい

    テキスト文に含まれている 半角スペースや半角文字を全部削除したいのですが エディターを使い正規表現か何かで一度に処理する方法を教えてください

  • 色々、文字処理ができるテキストエディタ。

     細かな文字処理ができるテキストエディタを探しています。 フリーソフトに詳しいご主人様、お願いします♪ 基本、oeditを使っています。 普通使うテキストエディタ以外で、文字処理に特化したソフトがあったら嬉しいのです。 欲しい機能は、 特定のキーワードの行、以外を削除する機能や 行の先頭で半角空白や文字を入れる。 今は、エクセルで全部の行をソートして、特定の行を探し当てて、手動で先頭に一文字入れて、置換しています。 これが、面倒です。 もし使っているご主人様がいたら、教えてくださいね♪

  • 正規表現で全角数字を半角数字に置換する方法は?

    いつもお世話になっております。 テキスト内の全角数字5桁のみを該当の半角数字5桁に置換する方法を探しています。 OS:Win テキストエディタ:sakuraエディタ、秀丸 例) ---------------------------------------- あいうえお01234かきくけこ99さしすせそ ↓ あいうえお01234かきくけこ99さしすせそ ---------------------------------------- 正規表現で行えばいいと思い、置換文字列を  [0-9][0-9][0-9][0-9][0-9] あるいは  [0-9]{5} にしましたが、置換後の文字列が分かりません。 試しに検索で上記の文字列を試すと、該当箇所がマークされるので、 置換前の文字列は合っています。 置換後の文字列をご教授願えますでしょうか。 ※テキストエディタで無理ならプログラム組みます。 VBScriptを考えていますが、他に良い言語があれば併せて教えてください。

専門家に質問してみよう