ベストアンサー

文字列数の高速なカウント

2020/05/28 17:58

あるファイルに入っている文字列をカウントする早い方法を探しています。 grep -c "sample"やawk '{if($1 ="sample") print}' |wc などを試していますが、巨大なファイルのためすごく時間がかかっています。他に何か早く計算できる方法はないでしょうか？

hiroponsettu
お礼率21% (3/14)

その他（プログラミング・開発）
回答数2
ありがとう数1

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

notnot
ベストアンサー率47% (4846/10257)

2020/05/28 21:18 回答No.2

grep -c "sample" が最速です。fgrep -c "sample" が幽かに早いかも知れませんが。 cp ファイル名 /dev/null を実行してみてください。それがファイルを全部読む時間で、ファイルを全部読む以上、それよりは速くなりません。

その他の回答 (1)

maiko04
ベストアンサー率17% (345/1956)

2020/05/28 20:44 回答No.1

コマンドに対抗するなら（可能性ですけど）自作してコンパイルしたもののほうが速いかもです。コマンドは広い要求に対応したり、不用意に異常終了しないためにデータを確認しているところがありますのでこういう場合は冗長になります。 awkはコンパイルされずにインタプリタで実行されています。（環境によります）

関連するQ&A

ファイルからある文字列の個数を数えたい
perl5でunixの"wc"や"grep -c"みたいに１つのファイルの中からある文字列の個数をカウントするスクリプトを作ろうとしています。ファイルは256文字×10万行くらいのテキストで、検索する文字列は15文字前後×40個(例えば「apple-000001」「lemon_orange」など)です。どのようなスクリプトを組んだら効率よく各文字列をカウントできるのでしょうか？それよりwcやgrep -cを40回行った方が早いのでしょうか？
- ベストアンサー
- Perl
Ｂシェル　文字列に含まれる特定文字のカウント
文字列の中に特定の文字が何個含まれているのかを知りたいです。wcやgrep を使ってみましたが、うまくいきません。教えてください。例えば「123456789abc1defg0123456789」の中に「1」は３個含まれているってのを調べたいです。
- ベストアンサー
- その他（プログラミング・開発）
awkで可変文字列をマッチング
シェルなどでawkを使う際に、シェルの引数として渡された文字列をawkに渡し、それを条件にマッチングをかけたいのですが、どうしたら良いのでしょうか？（まあ、素直にgrepを使えばいいのですが・・・）例えば、 cat foo.txt | awk '{if ($2 == ptn) print}' ptn=$<シェルの引数> とかやれば、２番目のフィールドに完全に一致する行が抽出できるのですが、 cat foo.txt | awk '/ptn/ {print}' ptn=$<シェルの引数> とかやっても、"ptn"という文字列をマッチングしてしまうので、うまくいきません。どの位置に出現するかわからないけど、シェルの引数で指定された文字列が含まれている行だけを出力したい場合、どうしたらよいのでしょう・・・。
- ベストアンサー
- その他（プログラミング・開発）
awk の使い方
sample.txt　ファイルには　　"中村"　"08/01/80"　"03.1234.5678" 　　"木村"　"08/01/81"　"06.1252.2536" のような情報があります。そこの3番フィールドが電話番号ですので、awkで検索しようと思っています。それで、 awk -v ARGU="$NUM" ' { VAR=substr($3,2,(length($3)-2)) if ( ARGU == VAR ) {print} }' /sample.txt のようにして、検索をかけようとしましたが、できません。どこが間違っているのか教えてください。 awkの他の方法があるとか、違うもの（sed　or　grep）でできるのであれば、お願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
DOSバッチで文字数カウント
DOSバッチでファイル内の文字数をカウントする方法をご存じの方はいませんでしょうか？？ UNIXでいうところの「wc -c」です。使用OSは、Windows2003ServerとWindowsXPです。ユーティリティーなどは導入できず、DOSバッチで実現しなくてはなりません。どなたかご助力をお願いいたします。
- ベストアンサー
- Windows系OS
文字列をカウントするにはどうすればいいのでしょうか？
ファイル読み込み後その中の特定の文字列、「映画」の個数をカウントするというプログラムを次のように作ってみましたが、実際に起動してみるとエラーになります。何かわかる方がいれば教えてください。 #!/usr/local/bin/perl if (open(FH, "data/log.txt")) { @file = <FH>; close(FH); } foreach $count (@file){ $count = ($line =~ tr/映画/映画/); } print $count; exit;
- ベストアンサー
- CGI
エクセルでの行数カウント
エクセルで A列 B列 1行 ●1 C ⇒カウント 2行 X1 D　 3行 ●2 E 4行 X2 F 5行 ●3 C ⇒カウント 6行 ●4 D 7行 X3 E A列で「●」を含み、なおかつB列で「C」である行の数（例でいうと「2」）を求める数式を教えてください。ちなみに A列 B列 1行 ● C ⇒カウント 2行 X1 D　 3行 ● E 4行 X2 F 5行 ● C ⇒カウント 6行 ● D 7行 X3 E であればA列が全く「●」に等しいものでカウントする場合は、下記の関数で計算できます。 {=SUM(IF(B1:B7="C",IF(A1:A7="●",1,0)))} COUNTIF関数では、"●*"のように「任意の文字」を指定することが可能ですが、IF関数の中ではできないようです。
- ベストアンサー
- オフィス系ソフト
バイナリファイルの特定のバイナリ値をカウントする方法は？
お世話になります。質問です。バイナリファイルから特定のバイナリ値を抽出して、１バイト単位でカウントする方法はありますか？（例）バイナリファイル"FileA"のバイナリ値0xffをカウントする。＜FileAの中身＞ 0xfe 0xff 0xff 0x12 0x00 0x00 0xff 0x01 0x00 ↑のファイルから0xffを3カウントした。 $ hexdump -v <ファイル> | grep <ターゲットの値> | wc -w （質問を書いてる現在、linux環境が無いので記憶を頼りに書いてますので間違ってると思います） ↑のようにのような方法は思いつきましたが「一度テキストにして～grepにパイプして～wcにパイプする」となると、ファイルサイズに依っては処理に数時間費やしてしまいます。なので、以下の条件を満たす方法を探しています。 (1)処理の無駄が少ない（バイナリを直接探す方法等） (2)できるだけシンプルにコマンドライン一行で実現 (3)スクリプトファイルを含むソースファイルを作る作業無しよろしくお願いします。
- ベストアンサー
- Linux系OS
awk の使い方
sample.txt　ファイルには　　"中村"　"08/01/80"　"03.1234.5678" 　　"木村"　"08/01/81"　"06.1252.2536" のような情報があります。(フィールドの区別はTabです) そこの3番フィールドが電話番号ですので、awkで検索しようと思っています。それで、 $ shell 06.1252.2536 #!/bin/sh NUM=$1　　　　　　　　　　　　　　　　　　　　#引数をNUMに代入 awk -v ARGU="$NUM" ' { VAR=substr($3,2,(length($3)-2))　　　　　　#「"」を取り除いた if ( ARGU == VAR ) {print}　　　　　　　　　#電話番号と比較 }' /sample.txt のようにして、検索をかけようとしましたが、できません。どこが間違っているのか教えてください。 awkの他の方法があるとか、違うもの（sed　or　grep）でできるのであれば、お願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
EXCEL、文字の数をカウントしたい。
エクセル関数を使って、文字（１００文字以上）の数をカウントしたいのですが、可能でしょうか。例えば：セルに一つずつ、ＡＢＣＡＡＡＣＤを入力した場合に、A＝4、B＝1、C＝2、D＝1　のように表示したいんです。 ※Aを数える場合に、IF関数を使ってAのとき1となるように IF(A1="A",1)+IF(A2="A",1)＋・・・＋・・・のように順次足していけば短い文字であれば可能ですが、文字数が多くなってくると、セル内に関数がはいりきらずに計算できなくなります。別の関数をつかってより簡単に計算できないでしょうか？
- ベストアンサー
- オフィス系ソフト

文字列数の高速なカウント

質問者が選んだベストアンサー

その他の回答 (1)

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

文字列数の高速なカウント

質問者が選んだベストアンサー

その他の回答 (1)

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録