ベストアンサー

ファイル内で重複している数と重複した回数

2006/09/29 16:09

開くファイルの中身は数字のみ。 1行に一つずつ数字が入っており、それが何行にもわたり続くファイルです。ファイル内で重複している数と重複した回数を数えたいです。以下のようなスクリプトを使ったのですが、結果を表示させようとすると global symbol"$hash" requires explicit package name. にエラーが出ます。何故なのでしょうか。 use strict; # ファイルを開く my $INPUT_FILE; open ($INPUT_FILE, ">numbers.dat") or die “Can't open. \n”; # それぞれの数をハッシュキーにする。そして対応するバリューを同じ数を見つける度毎にカウントアップする。 my %hash = (); while (my $line = readline($INPUT_FILE)) { chomp $line; $hash{$line}++; } # キーでソートし、結果を表示する。 my @keys = sort keys %hash; foreach my $key (@keys) { print “$key is found $hash{$key} times\n”; } close ($INPUT_FILE) or die “can't close the file\n”;

spring921
お礼率20% (5/24)

Perl
回答数5
ありがとう数2

みんなの回答 （5）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

Tacosan
ベストアンサー率23% (3656/15482)

2006/09/29 16:22 回答No.1

ん～, 手元では問題ないけどなぁ.... ちなみに 2点ほど疑問: ・なんで ">number.dat" なの? ・die のあとの文字列の引用符が全角なのはなぜ?

質問者

補足 2006/09/30 15:32

なんで ">number.dat" なの? ---reading用にファイルを開きたかったからです。 die のあとの文字列の引用符が全角なのはなぜ? ---特に意味はありません。

その他の回答 (4)

Tacosan
ベストアンサー率23% (3656/15482)

2006/09/30 13:34 回答No.5

「どうにも動かない」と言われても, どんなプログラムを使っているのかわからないんだからどうしようもないです. そもそも最初に挙げられたプログラムから間違ってるんだし. 実際に使っているプログラムを示せませんか? ちなみに my で宣言した変数を使って open でファイルハンドルで autovivify するのは, 「my のスコープが終わったときに勝手にファイルを close してくれる」というメリットがあります＞#3.

kumoz
ベストアンサー率64% (120/185)

2006/09/29 19:17 回答No.4

エラーの対象が "%hash" ではなくスカラー変数の "$hash" ですので、実際のコードでは何らかの書き間違いがあるのではないかと思います。例えば、次のように書くと質問のようなエラーが出ます。 print "$key if found $hash {$key} times\n";

質問者

補足 2006/09/30 06:53

エラーは消えました。ありがとうございます。でも、次は何も表示されないままになってしまいました。ここでは書き忘れたのですが、while文はサブルーチン内に入っています。どうにも動きません。アドバイスを頂ければ、幸いです。

pipipi523
ベストアンサー率40% (148/365)

2006/09/29 18:12 回答No.3

global symbol"$hash" requires explicit package name. は、 use strict; を入れているからでは？消して実行してみてください。 (ちなみにWindowsのActivePerlではエラーになりませんでした。外していたらすみません) その他・">numbers.dat"の場合は出力モードになるので、　実行するとnumbers.datの中身が空になります。>は消しましょう。・openの第一引数はファイルハンドルでなので、　my $INPUT_FILE; 　open ($INPUT_FILE, "numbers.dat") or die "Can't open. \n"; 　ではなく、　open (INPUT_FILE, "numbers.dat") or die "Can't open. \n"; 　としたほうがいいと思います。(変数名を書くと動くにしてもちょっと気持ち悪い)

質問者

お礼 2006/09/30 06:57

ご回答いただき　ありがとうございます。ここでは書き忘れたのですが、while文はサブルーチン内に入っています。サブルーチンを外すと確かに正常に動きました。なぜサブルーチンに入れた瞬間に表示されないようになってしまうのでしょうか。コメントを頂ければ、幸いです。

BLUEPIXY
ベストアンサー率50% (3003/5914)

2006/09/29 17:17 回答No.2

これってホントに使ってるソースですか？

関連するQ&A

指定の行数目から行を抽出する
いつもお世話になっております．環境はWindows XP Pro でActiveperlを使っています． Perlでしたいことは，「指定の行数目から行を抽出する」ことです．具体的には以下のようにしたいと思っております． data.txt A B C D E F line.txt 2 4 6 output.txt B D F 先ほどある方からサンプルソースを教えてもらったのでそれをベースに作ってみましたが，出力のoutput.txtが空のままです． use strict; use warnings; use feature ':5.10'; use IO::File; open my $file2, '<', 'line.txt' or die "can't open input $!"; chomp(my @subjects = <$file2>); close $file2; open my $newfile, '>>', 'data_out.txt' or die "can't open output $!"; open my $file, '<', 'data.txt' or die "can't open input $!"; while (my $line = <$file>) { chomp $line; foreach my $line (@line) { print $line; if ($. eq $subjects){ say {$newfile} $line; } } } close $file; close $newfile; どこが間違っているのでしょうか．ご指摘ください．よろしくお願いします．
- ベストアンサー
- Perl
not enough argument in 3rd line & does not show the right response
test.datの中身は以下の通り。 line a b c d 1 1a 1b 1c 1d 2 2a 2b 2c 2d 文字と文字の間の空間はタブです。 open (my $SIM_FILE, "test.dat") or die "can't open the file\n"; my @cols = split /\t/, readline($SIM_FILE); my %simulation = &read(@col); close $SIM_FILE; while ((my $key, my $value) = each(%simulation)) { print "$key : $value\n"; } sub read { while (my $line = readline($SIM_FILE)) { chomp $line; next unless ($line); my @values = split /\t/, $line; if (@values == @cols) { my %tmp_hash; my $year for (my $i = 0; $i<@cols; $i++) { $tmp_hash{$cols[$i]} = $values[$i]; $year = $values[$i] if ($col[$i] =~ /^year$/i); } $simulation{$year} = \%tmp_hash; } } }
- ベストアンサー
- Perl
静的ハッシュの配列のキーに対応する値の数の多さ順で表示させたい
ハッシュのキーに対応する値の数の多さ順で表示させたいと考え、下記の所まで試行錯誤しておりますが、どうにも思ったようにソートできずにおります。 #!/usr/bin/perl use strict; my(%a, $i, $j ,$allarray ,@keys ,@keys2 ,%hash ,%files ,$a_mumei_ref ,$key ,$value ,@value ,$x ,$files); # ハッシュの配列を静的に作る %a = ( '0' => [ qw(0) ], '1' => [ qw(1 1) ], '3' => [ qw(3 3 3) ], '7' => [ qw(7 7 7) ], '2' => [ qw(2) ], '4' => [ qw() ], '5' => [ qw() ], '6' => [ qw() ], '8' => [ qw(8 8) ], '9' => [ qw(9) ], ); @keys = sort { $hash{$b} <=> $hash{$a} || length($b) <=> length($a) || $a cmp $b } keys %a; #ハッシュのキーを数字順で表示 foreach (@keys){ print $_ ."\n"; } # 静的に作ったハッシュの配列を取り出してみる foreach $i (sort keys %a) { for ($j = 0; $j <= scalar(@{$a{$i}})-1; $j++) { print '$a{'. $i. '}['. $j. ']='. $a{$i}[$j]. ' '; } $allarray=scalar(@{$a{$i}})-1; print "No$i:kosuu:$allarray"; print "\n"; #配列の値の個数を調べその配列を作成 my($a_mumei) = $allarray; $a_mumei_ref = \$a_mumei; $files{"$i"}=($i,$a_mumei_ref); } #each関数で%filesの中身を表示 while ( ( $key , $value ) = each %files ){ print "key:$key value:$$value\n" ; } #試行錯誤 foreach $x (sort { $files{$b} <=> $files{$a} } keys %files){ print "$x => $files->{$x}\n"; } @keys2 = sort {$hash{$a} <=> $hash{$b}} keys %files; #@keys2 = sort { $hash{$b} <=> $hash{$a} || length($b) <=> length($a) || $a cmp $b } keys %files; #@keys2 = sort { $hash{$a} cmp $hash{$b} } keys %files; print "@keys2\n"; print "\n"; __END__; 私のイメージしておりますのは、ソートした結果がハッシュのキーに対応する値の数の多さ順で下記のように表示させたいのですが、どのようにすれば可能でございますか、ご教授願えませんでしょうか key:3 value:2・・・この場合valueは配列の個数 key:7 value:2 key:8 value:1 key:1 value:1 key:9 value:0 key:2 value:0 key:0 value:0 key:6 value:-1 key:4 value:-1 key:5 value:-1
- ベストアンサー
- Perl
先頭の単語が一致した時のデータ追加
【データ】 (A) A　A2　"one"　7 A　3C　three　9 B　DD　"two"　11 C CDE　four　25 C　4D　five　33 D　YY　six　27 ・・ (B) A　okinawa kagoshima miyazaki B　kumamoto oita D fukuoka E　saga nagasaki ・ (A)と(B)のデータを比較し、先頭の単語が一致した時のみ、先頭の単語を除いた(B)の行を (A)の末尾に加えるという処理をしたいです。【目標】 A　A2　"one"　7　okinawa kagoshima miyazaki A　3C　three　9　okinawa kagoshima miyazaki B　DD　"two"　11　kumamoto oita C CDE　four　25 C　4D　five　33 D　YY　six　27　fukuoka ・・以前、回答して頂いた方法を踏まえ、以下の処理を行いましたが上記のような結果がでません。宜しくお願いします。 #!/usr/bin/perl open(FILE1, "<aaa.txt") || die "File1 Open Error! \n"; open(FILE2, "<bbb.txt") || die "File2 Open Error! \n"; open(OUT, ">zzz.txt") || die "OUT Open Error! \n"; my @data1 = <FILE1>; my @data2 = <FILE2>; chomp @data1; chomp @data2; foreach my $line1 (@data1) { my @array1 = split(/\t/, $line1); push @{$hash1{$array1[0]}}, @array1[1, -1]; for my $key1 (sort keys %hash1){ foreach my $line2 (@data2) { my @array2 = split(/\t/, $line2); push @{$hash2{$array2[0]}}, @array2[1, -1]; for my $key2 (sort keys %hash2){ if($key1 eq $key2){ print OUT join("\t", ($key2, @{$hash2{$key2}}, @{$hash1{$key1}})), "\n"; } } } } }
- ベストアンサー
- Perl
perlでCSVをソートする方法について
perl初心者です。いつもありがとうございます。 perlでcsvファイル(1行のカラム数は200)、総行数は約３万行のファイルを37番目のカラム(-25以上25未満の数値データ)で降順ソートしその値によって行数がだいたい均等になるよう3分割し、2番目のカラムに文字でも数字でもよいのですがその４つのグループごとにフラグ(例えば1,2,3)を入れたいと思ってます。グループ化については境目の37番カラムの値は重複している場合が多いと思うのですがその場合は下(別に上でもかまいません)に入れるものとします。ソートロジックは過去の質問を参照して理解しましたがグループ化しフラグを入れるルーチンがうまく作れません。下記のように作ったのですがこの先同じことを何度もやらなくてはならないので先に進めません。どなたかお助けください。最終的にやりたいことはカラム37でグループ化→カラム2にフラグを立てる、次にカラム2とカラム38(-25から0までの数値)でソートし同様に同じ行数になるようにグループ化→カラム3にフラグを立てる、さらにカラム2とカラム3とカラム39(-25以上25未満の数値データ)でソートし・・・同様に繰り返し最終的に1グループが100件(行)～150件(行)になるようにしたいのです。つまり約３万件のデータを3*4*2*4*2=192分割(5列の値で分類)したい、そしてどのような範囲で分割したかという情報も得たいのです。 use strict; use warnings; use utf8; use Encode; binmode STDOUT, ':encoding(utf-8)'; my $dir = './data'; # 処理するディレクトリ my $motoFile = 'customer.txt'; # もとファイル open my $fh, '<:encoding(cp932)', "$dir/$motoFile" or die 'ファイルが開けません。',"$!"; my %sorted; while (my $line = <$fh>) { my $key = (split /,/, $line)[37]; push @{$sorted{$key}}, $line; if (@{$sorted{$key}} == 1000) { open OUT, '>>:encoding(cp932)', "$dir/$key.tmp" or die "Can't open: $!"; print OUT @{$sorted{$key}}; close OUT; @{$sorted{$key}} = (); } } open OUT, '>:encoding(cp932)', "$dir/out.txt" or die "Can't open: $!"; foreach my $key (sort { $b <=> $a } keys %sorted) { if (-e "$key.tmp") { open IN, '<:encoding(cp932)', "$dir/$key.tmp" or die "Can't open: $!"; print OUT while <IN>; close IN; } print OUT @{$sorted{$key}} if @{$sorted{$key}}; } close OUT; #↓↓↓↓ここからフラグを作成するルーチン # 行数を調べ3つに分けるルーチン my @colum37; open IN, '<:encoding(cp932)', "$dir/out.txt" or die 'ファイルが開けません。',"$!"; my @in = <IN>; close IN; my $gyousuu = scalar(@in); my $amari = $gyousuu % 3; if ($amari == 0) { my $groupGyousuu = ($gyousuu-$amari)/3; print "総行数は$gyousuu","で、1グループの行数は$groupGyousuu","ほど、余りは$amari\n"; # あまりが0の時、group1は@inの0行～$groupGyousuu-1行まで # 　　　　　　　 group2は@inの$groupGyousuu行～$groupGyousuu*2-1行まで # 　　　　　　　 group3は@inの$groupGyousuu*2行～$groupGyousuu*3-1行まで foreach my $num (1..2) { push @colum37, (split /,/, $in[$groupGyousuu*$num])[37]; # これは境目の先頭の37番目 } print "@colum37\n"; #これでここまでは完成、分けるべき値がこの配列に入っている。 open OUT, '>:encoding(cp932)', "$dir/out.txt" or die "Can't open: $!"; foreach my $line (@in) { my @line = split /,/,$line; if ($line[37]>=$colum37[0]) { $line[1] = 1; }elsif ($line[37]>=$colum37[1] and $line[37]<$colum37[0]) { $line[1] = 2; }elsif ($line[37]<$colum37[1]) { $line[1] = 3; } $line = join (',',@line); print OUT $line; } close OUT; } elsif ($amari == 1) { この後未作成
- ベストアンサー
- Perl
一つのテキストファイルと複数のファイルの結合
よろしくお願いします．ディレクトリ内の一つのテキストファイル(joint.txt)と複数のファイルの結合を行ごとに隣へ結合するプログラムを作成しています．ここで以下のプログラムを作成したのですが，うまくいかないため，誤っている部分をご指摘願えないでしょうか． my $dirname = '.'; opendir(DIR, $dirname) or die "$dirname: $!"; while (my $dir = readdir(DIR)) { next unless (-f $dir); next unless ($dir =~ /\.txt$/); open(FILE, $dir) or die "$dir: $!"; open(FILE2,"joint.txt"); my @file = <FILE>; my @file2 = <FILE2>; close(FILE); close(FILE2); foreach my $line (@file) { foreach my $line2 (@file2) { chomp $line2; $line = "$line2.",".$line"; } } open(NEWFILE, "> $dir") or die "$dir: $!"; print NEWFILE @file; print NEWFILE @file2; close(NEWFILE); } closedir(DIR);
- ベストアンサー
- Perl
【初歩的質問】重複データがある時のハッシュへの代入について
perl5.8です。すごくしようもない質問で申し訳ないのですが、次のようなファイルfile.txtの内容を、ハッシュ%hashに入れていくとします。 --- file.txtの中身 --- a,1 c,3 a,1 b,2 c,3 ----------------------- --- ソース（抜粋) ----- open(IN, "file.txt"); @data = <IN>; close(IN); %hash = (); foreach(@data){ chomp $_; @out = split(/,/, $_); $hash{$out[0]} = $out[1]; } ----------------------- 上記の結果は当然ながら、$hash{a}=1,$hash{c}=3,$hash{b}=2となるのですが、重複したデータを読み込んでハッシュに入れようとした時に、ワーニングなりエラーがなにも出なかったのがちょっと気持ち悪いです。重複したキーを読み込んだ時は、内部的には黙ってはじいてくれていると解釈してよいのでしょうか？そうだとすると、こういう書き方は、重複した行を排除するテクニックとなりえるのでしょうか？
- 締切済み
- Perl
perlで文書を読み込み検索置換したい
MAC OS Xを使用しています。検索置換のプログラムをperで作成し、Applescript上で呼び出したいのです。実際はファイルメーカーのスクリプトの中でApplescriptを記述してその中で呼び出したいのです。 do shell script "perl ～.pl"という感じで使えるのではないかと下記のようなサンプルスクリプトを見つけたのですが内容の更新の仕方がよく分かりません。 perlについては全くの初心者でいろいろ調べたのですがよく理解できませんでした。検索置換したいのですが、どういうふうに書けばいいのでしょうか。 (2)の部分を教えて下さい。宜しくお願いします。 use strict; use warnings; use File::Copy 'move'; # (1) ファイルの内容を読み込む my $file = 'F:\共有\PERL\test.txt'; open my $fh, '<', $file or die qq/Can't open file "$file": $!/; my $content = do {local $/; <$fh>}; close $fh; # (2) 内容の更新　▼をリターンに置き換えたいのです。 $line =~s/▼/\n/; # (3) 一時ファイルへの書き出し my $temp_file = "$file.$$." . int(rand 10000); open my $temp_fh, '>', $temp_file or die qq/Can't open file "$file": $!/; print $temp_fh $content; close $temp_fh or die qq/Can't open file "$file": $!/; # (4) 一時ファイル名を元のファイル名に変更 move $temp_file, $file or die qq/Can't move "$temp_file" to "$file": $!/;
- 締切済み
- Perl
perl　配列名変数指定するには
perlプログラムで for文で　ループ分の配列定義するには　どうしたらよいですか？下記のようなことができないかと　考えております。 for(my $i = 0; $i < $file_no; $i++){ my @{"segments$i"} =();　#配列定義 my ${"line$i"}="";　　　　　#変数定義 my %{"hash$i"}= ();　　　　#ハッシュ定義 open(ARG1,$ARGV[$i]); while(<ARG1>){ ${'line'.$i} = $_; chomp ${'line'.$i}; @{'segments'.$i} = split(/\t/,${'line'.$i}); 　　　　　　　${'hash'.$i}{${'segments'.$i}[0]}=${'segments'.$i}[1]; 　　　　｝ close(ARG1); } #下記で、その後　各ハッシュに設定したデータをもとに　いろいろ計算したい foreach my $a (keys %{'hash'.$i}){ ・・・｝今は、Can't declare array dereference in "my" at test.pl line XX, near "} ="　と　配列定義でエラーとなり処理できません。
- ベストアンサー
- Perl
重複文字列の消去について
同じファイル内での重複文字列の消去について教えてください。以下のようなファイルがあった時に ---text--- 100 フランチャイズ 98 二酸化炭素 76 ワールドカップ・・・ 4 排出二酸化炭素 3 直営フランチャイズ 3 サッカーワールドカップ 1 ２００９年ワールドカップ ------- 「排出二酸化炭素、直営フランチャイズ、サッカーワールドカップ、２００９年ワールドカップ」はファイル上位のキーワードと重複する部分があるので消去したいと考えています。まず、以下の処理で不要部分の抽出を考えてみたのですが、ループが一度しか回らずに処理が停止してしまいました。どのようにするとよいでしょうか。よろしくお願いいたします。 my $file = "text"; open( my $fh, "<", $file ) or die "Cannot open $file: $!"; my $lineheader = ''; while (<>) { $lineheader = (split)[1]; while(my $line = readline $fh){ if($line =~ /$lineheader/){ print $line; } $lineheader = ""; } }
- ベストアンサー
- Perl

ファイル内で重複している数と重複した回数