締切済み

grepで全角文字の行を抽出

2009/10/20 17:38

grepの検索でテキスト内のひとつでも全角文字がある行を抽出したいと思ってます。１つの方法は見つかったのですが、時たまバグがあるそうですので、他の方法を探そうと思ってます。わかっている方法は、以下のとおりです。＞ grep -n '.*[^ -~。-゜].*' test_data.txt よろしくお願いします。

tama1972
お礼率100% (1/1)

Linux系OS
回答数1
ありがとう数2

みんなの回答 （1）
専門家の回答

みんなの回答

notnot
ベストアンサー率47% (4847/10260)

2009/10/20 21:07 回答No.1

「ASCIIに含まれる文字だけ」の行以外という案で、 LANG=C で、ロケール(言語)を英語にした上で、grep -v で除外を指定。 LANG=C grep -n -v '^[[:cntrl:][:print:]]*$' test_data.txt

質問者

お礼 2009/10/21 09:23

ご回答ありがとうございます。やってみたのですが、半角カタカナのみも反応してしまいました。申し訳ないですが・・・

関連するQ&A

grepによる文字列検索のシェル作成の手順
Solaris9のOSにて、以下の仕様のシェルを作成したいと思っています。特定のディレクトリ配下にある全てのファイル内で特定の文字列「abc」のある行を抽出し、ファイル化したい。（検索対象が１ファイルであれば、grep -n abc test.txtでよいですが、ファイル名がたくさんある場合のシェルの作り方がわかりません。）また、どのファイルから検索したのかがわかるように抽出した行の前にファイル名をつけられると大変助かります。例） ---test1.txtから検索--- 8:XXXXabcXXXX 11:XXXXabcXXX ---test2.txtから検索--- 10:XXXXXXXXabcXX お手数ですが、宜しくお願いします。
- ベストアンサー
- Solaris系OS
grepで検索行以外の行を抽出する方法
grepをかけると検索文字列を含む行を抽出しますが検索文字列を含む行とその前後の行も出力したりできるのでしょうか？よろしくお願いします。
- ベストアンサー
- その他（プログラミング・開発）
grepでの抽出について
solarisでgrepを使ってログの抽出を行っているのですが、 123のある行を抽出したいとき、grep 123 ファイル名とすると 1234のある行も一緒に抽出されると思います。これを123のみ抽出させる方法を教えてください。
- ベストアンサー
- その他([技術者向] コンピューター)
grepで検索文字列が完全一致した行だけ取り出す方法
grepの文字列検索で検索文字列が単語として、完全一致した行だけ取り出す方法はないでしょうか？通常は grep hoge hoge.txt と打つと、hogeが含まれる行が出力されますが、今回は含まれる行ではなくて完全に文字列が一致した行だけ取り出したいのです。例えばhoge.txtの中に cc ghoge kkl hogem jjll hoge という3行があったとしたら最後の行でhogeという文字が空白で区切られた行だけ取り出したいのです。何かよい方法があれば教えてください
- ベストアンサー
- Linux系OS
正規表現を使った文字列の抽出方法について
正規表現を使った文字列の抽出方法について RHELを使っています。テキストデータの中に、以下のようなデータが百万行単位で並んでいます。（カンマ区切り、2列構成） 1, 1.24425 2, 3.25252 （中略） 13, 6.25365 14, 8,36222 （中略） 103633, 252525.0 最終的にやりたいことは2列目のデータのみの抽出です。考え方として、正規表現で「<任意の文字列の連続><カンマ>」という文字列を認識させ、それを「空欄」で置換したいと考えています。文字列の最後の文字をマッチさせる指定子が「$」という情報をWebで見つけたのでまず、grepで見つけられるか以下のようにやってみたのですが、 grep -i ",$" test.txt $が環境変数と取られ、構文エラーとなってしまいます。使い方がおかしいのでしょうか？ちなみに、うすうす感じている疑問として、「$」は文末にくるものしかマッチしなかったりしますでしょうか？カンマ区切りなので、表計算ソフトを使えなくもないですが、行数がExcel2007の限界をよく超えるので、それ以外の方法で考えています。アドバイスよろしくお願いいたします。
- ベストアンサー
- Linux系OS
特定の文字列が一致する行から、文字列を抽出する方法
ファイルから、特定の文字列を検索し、その文字列に対応する文字列を取得したいのですが、どなたか方法を教えていただけないでしょうか？処理： test.txt中に以下の文字列が記載されています。 ----- TEST011:FILE00 TEST01:FILE01 TEST02:FILE02 XTEST01:FILE01 XTEST02:FILE02 ----- test.txtから、TEST01に対応する文字列FILE01を取得したいです。当初、strchrを利用すれば良いかと考えていたのですが、 TEST011の行が先に抽出されてしまい、うまくいきません。どなたか解決方法を教えていただけないでしょうか。
- ベストアンサー
- C・C++・C#
改行を含んだgrep
お世話になっております。質問です。エディタでサクラを使っています。改行を含んだgrepはできますか？また、以下のやりかたを見ていただいて、良いやり方がありましたらご教示下さい。 ABCを含んだ行を対象に、;（行の終わり）までを抽出したいのです。現在以下のような条件でgrepしていますが、ABCを含む行全てが抽出されません。 ABC.*(\r\n)*.*; また、以下のようにgrepすると、ABCを含む行全てがgrepされますが、対象ファイル内で改行されていた場合、;まで抽出されず、改行場所までしか抽出されません。 ABC; 詳しい方、宜しくお願い致します。
- 締切済み
- その他([技術者向] コンピューター)
DOSの文字抽出
findstrで特定の行を抽出できました。 test.txtというファイルに入っています。８５文字のうちの４３行目から８文字抽出したいのですが、どうすればいいでしょうか？
- 締切済み
- その他（プログラミング・開発）
テキストから複数の任意の文字列を含んだ行を抽出したいです
cat test.txt | grep aaabbb とするとaaabbbを含んだ行を抜き出せるんですが、 aaabbbまたはcccdddという文字列を含んだ行を抜き出したいときにはどうすればいいでしょうか？どちらか一方もしくは両方を含んだ行を抜き出してほしいです。ログを見る際に使いたいのでコマンド一つで出来ると助かります。
- ベストアンサー
- Linux系OS
クエリーで、全角混じりデータの抽出[access95]
半角で入力すべきフィールドの中に全角文字が混在している時に、この全角文字が混在しているデータを、クエリーで抽出する方法を教えてください。データ型はテキストで、フィールド長は50です。また入力されているデータは、任意<50文字とないっています。
- ベストアンサー
- オフィス系ソフト

grepで全角文字の行を抽出

みんなの回答

お礼 2009/10/21 09:23

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

grepで全角文字の行を抽出

みんなの回答

お礼 2009/10/21 09:23

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録