- 締切済み
データを並び替えたときの標準偏差
こんにちは。 以下のような実験を行ったのですが、その解釈についてご教授お願いします。 【操作(1)】 ある測定を150回繰り返したときの結果を、測定の時系列順に並べたものを、X(1)、X(2)、・・・、X(150) とします。 これを時系列順に3個ずつ平均値を取ったものをA(1)、A(2)、・・・、A(30)とし、この平均値Aの標準偏差をσ1とします。 【操作(2)】 上記のデータXを乱数(エクセルのRND関数)を使って、並び替える。 例) X(126)、X(54)、・・・、X(3) これを順に3個ずつ平均を取ったものをA'(1),A'(2),・・・A'(30)とし、このA'の標準偏差をσ2とします。 操作(2)を10回行ったところ、10回ともσ1のほうがσ2よりも大きくなりました。 Xの値が測定時間に依らないのであるなら、必ずしもσ1>σ2とならないのではないかと思います。 これはXに何らかの周期的な成分が含まれているということなのでしょうか。 それとも、上記操作を行ったとき、σ1>σ2となることは、自明なのでしょうか。 よろしくお願いします。
- みんなの回答 (5)
- 専門家の回答
みんなの回答
- rabbit_cat
- ベストアンサー率40% (829/2062)
そういうふうに時系列データを並び替えて、同じ処理をしてみて、元のデータに対する処理結果と比較する、という操作を「サロゲーション」と言ったりします。 あるいは、統計の分野では「ブートストラップ」なんていいます。 (ただし、今回の例は、並び替えると性質が変わってしまっているわけで、ブートストラップというには少し不適ですが。) おそらく、時系列データに自己相関があるんでしょう。特徴的な周期的な成分がなくても、単に自己相関がある程度あれば、そのような結果になると思われます。
- 中村 拓男(@tknakamuri)
- ベストアンサー率35% (674/1896)
時系列信号にして LPF を通しているのと同じだから 平滑されて分散が減少するのは当然だと思います。
- foomufoomu
- ベストアンサー率36% (1018/2761)
>Xの値が測定時間に依らないのであるなら、必ずしもσ1>σ2とならないのではないかと思います。 それでよいと思います。 >これはXに何らかの周期的な成分が含まれているということなのでしょうか。 周期3(以下?)で同じパターンを繰り返している成分がある、ということでしょう。 しかし、普通、平均をとってから標準偏差を計算するという事はしないものですが、なぜそんなことをするのでしょうか? 平均をとるのは、ハイカット フィルターを通していることになりますし、時間に依存しないデータでは標準偏差がかなり小さく計算されます。
- imoriimori
- ベストアンサー率54% (309/570)
「Xの値が測定時間に依らないのであるなら、必ずしもσ1>σ2とならないのではないかと思います。」私もそう思います。 「Xに何らかの周期的な成分が含まれている上記操作を行ったとき、σ1>σ2となることは、自明なのでしょうか」そんなはずはないと思います。 「Xに何らかの周期的な成分が含まれているということなのでしょうか」はなんとも云えませんが、とにかく何か癖のあるデータだと云うことでしょう。 例えばXがゆっくりとドリフトしていくようなケースではσ1>σ2となり得るように思います。
- doc_somday
- ベストアンサー率25% (219/861)
それはガウス分布を「強制的に」再分散させているためだと思います。 だたし私は素人。