実験データの処理について

このQ&Aのポイント
  • 実験データの処理に困っています。データを効率的に処理する方法を教えてください。
  • 実験データの処理方法に関してアドバイスをいただけませんか?処理効率を向上させる方法を教えてください。
  • 実験データ処理で問題が発生しています。効率的な処理方法を教えてください。どのようにすればデータの処理を迅速かつ正確に行えるのか知りたいです。
回答を見る
  • ベストアンサー

実験データの処理について

ある実験から得られたデータの処理に困っています。 得られたデータをa[k](k=1,2,3・・・)とします。さらに、λ[k]=a[k+1]-a[k]とするとします。ここでλの平均(Σλ[i=1→k])/kを出したいのですが、λの定義式よりΣλ[i=1→k]=a[k+1]-a[1]となり、測定したa[2]~a[k]の値が関係してこないので無駄になってしまいます。 このような時に、a[2]~a[k]も平均に関係するような処理の仕方を以前どこかで見たような気がするのですが、どのようにすればよいか教えていただけませんか? また参考になるサイトなども教えていただけると嬉しいです。 よろしくお願いします。

  • 科学
  • 回答数1
  • ありがとう数0

質問者が選んだベストアンサー

  • ベストアンサー
  • MASA_H
  • ベストアンサー率42% (64/151)
回答No.1

λの平均には、そもそも平均の概念から考えても途中のデータは関係ありません。 例えばa[k]をk秒後の基準位置からの距離とします。するとλは瞬間速度にあたります。よってλの平均は平均速度にあたりますがこれは始点と終点が求まれば経路によらず一定です。 相加平均以外のデータ群の特徴として考えられる情報としては平均からの散らばりをあらわす分散というものがあります。計算方法は σ^2=1/k*Σ(λ-(Σλ[i=1→k])/k)^2 です。ちなみにこれの平方根が標準偏差です。

codosou
質問者

補足

回答ありがとうございます。 そもそもそうすることが平均の考え方で問題は無かったんですね。そして、標準偏差や分散で途中のデータを特徴付けるということですね。僕がどこかで見たのはまさに標準偏差や分散のことだったのかもしれないです。

関連するQ&A

  • 実験値の統計処理-T分布-について

    今、実験値の統計処理を行っています。 同じ試料について一定量をサンプリングし、測定値を理論式に当てはめ、誤差伝播を考えた形x±Δxで実験値を算出しています。何度も測定を行ったので、平均値や分散などを計算したいんですが、処理の方法に困っています。 標本の平均値や分散などの不確かさは、それぞれに誤差伝播式 f:=f(x_i) ⇒ Δf = ( Σ(∂f/∂x_i)^2 Δx_i^2 )^(1/2) を当てはめて計算して良いですか? あと、t分布で母平均を推定したいんですが、標本の平均や分散に不確かさが含まれている場合、どのように計算すれば良いのでしょうか・・・?? 何卒ご教授宜しくお願いします。

  • 2重あるいは3重データの統計処理について教えてください。

    専門的ですが、培養のin vitro実験で一つの薬剤につきウエルを2つあるいは3つ使用しました。つまり、duplicate 、triplicateですね。で、その上清中のある濃度をそれぞれduplicateで測定し、平均濃度を出しました。その実験を5回繰り返した場合、統計処理としては、まず、各実験毎の2つあるいは3つの平均を出して、その平均が5個そろい、統計的有意を出すのでしょうか(つまりn=5になる?)。それとも、2X5(回)=10あるいは3X5(回)=15の値を用いて、統計処理していいのでしょうか(つまりn=10あるいはn=15になる?)。詳しくご解説してくださいましたら幸いです。宜しくお願いします。

  • データの整理と平均値のまとめ方

    よろしくお願いします。 現在、実験を行っており、データの整理をしているのですが、まとめ方で困っているので質問させていただきました。 9000ほどの母集団から100個取り出し、帯電量測定をします。正規分布であることを確認し、同じ実験を3回繰り返します。 このような実験を数種類行い、どのように変化したか(平均帯電量やバラつき具合など)を報告しようと思っています。 ところが、この実験はばらつきが大きく、サンプリングの計算をすると100個では平均の誤差(平均と標本平均の差)が大きくなっていしまいます。 100個以上の測定では大幅な時間がかかり実験としても成り立たず、効率が悪くなるため、また、他の数種類の実験結果との比較のために同じ100個で統一するために、100個で行いました。(100個でも誤差が大きくなる、というだけの話なので問題はないと思います) ですが、同じ実験を3回行った結果について疑問点が出てきました。 実験から得られた標本平均Xbarと標準偏差σを、 Xbar-k*√(σ^2*(N-n)/n/(N-1)) < μ < Xbar+k*√(σ^2*(N-n)/n/(N-1)) (信頼係数K、母集団N、標本数n) の式に用いて平均の範囲を出せると思います。(誤差が大きいということはこの範囲が大きくなるということですよね) 同じ実験を行って誤差の違い(平均μから近いか遠いか)はあれど、平均μの値はかならずどの実験でも範囲内に入るはずですよね。 ですが、3回行った実験のうち、範囲が重ならない結果(重複する範囲がない)が出てきました。3回すべて重ならなかったり、2個だけ重なって残り1個は重ならなかったりしました。重なれば少なくともその範囲に平均μがあると思っているのですが・・・ 最初はこの3回行った同じ実験でそれぞれ得られた平均の範囲から平均の範囲をある程度決められるかなと思っていました。(誤差が大きくても) 原因として何が考えられるか考えたのですが、 1. 3回の実験のうち、測定中に触ったり何かしてちゃんと測定を行えなかったなど何らかの影響でちゃんとしたデータではない実験があるため。 2. 実は同一条件ではなかった(異なる実験扱いで比較できない) どのようにデータをまとめていいか困っています。すべてのデータを載せるのも要領の関係で難しいので、まとめたいと思うのですが・・・ 自分の統計の勉強不足なのでしょうか。 それか、Xbar±3*σで範囲を決めようかとも迷っています。 何か「ここは間違ってるよ」とか「こういう風にしたら?」などありましたら書き込んでいただけないでしょうか? わかりづらい質問でお手数おかけしますが、ご教授いただけますでしょうか。 よろしくお願いします。

  • 科学的実験

    実験系の論文で、代表値として被験者全体の平均値が載せられることが多いと思います。大体は同一の試行が複数回繰り返され、測定精度を上げた実験が行われます。このような実験の場合の全体の平均値は、被験者1人当たりのの平均値を出しそれを全ての被験者で平均しているのでしょうか。それとも、各被験者の試行を全てまとめて平均を出しているのでしょうか?? 私は前者の仕方でならったのですが、平均の平均は全体の平均と一致しませんよね。一般的な方法はどちらでしょうか・・・。ご教授願います。

  • pHの平均値は出せない?統計処理はできない?

     ある実験をして(A処理、B処理)pH値データを得ました。それぞれ平均値を出してさらに有意差検定をおこないました。ところが、指導者から対数表現しているpHは単純に算術平均や統計処理をしてはならないと言われました。例えば、A処理:5.5~6.2、B処理:5.3~7.4と表現するのが適当で、統計処理もしない方がいいとのことでした。  では、pHで平均値を得たいときにはどうしたらよいのでしょうか?逆算して計算すべきなのでしょうか。また、本実験の場合、A処理の方が低い(と思われる)データを得たので、「有意に」低いと言いたいのですが、統計処理をするにはどうしたらよいのでしょうか。ご存知の方、お教え下さい。

  • for文を簡単な処理に書き変えたい

    いま、配列を作る作業をしているのですが、for文を使うと、forをいくつ書けば良いのか分からない状態です。 作ろうとしている配列が、A[X][Y]で、Xの要素数は固定で良いのですが、Yの要素数が実験のたびに変動するためです。そして、処理したいのが、この配列の各列の値を適当な値(このfor文の前に値が決まっています)を代入することです。 例えば、for文だと、Y=3のときには for(i=0;i<○;i++){ for(j=0;j<○;j++){ for(k=0;k<○;k++){ A[line][0] = C[i];//(Cという配列のi成分) A[line][1] = B[j]; A[line][2] = E[k]; } } } のように書くような内容なのですが、Yが増えると、for文も増やさないといけません。 ここで、再帰処理のような方法をつかってうまく書きたいのですが、どう書いたら良いのか分かりません。 一般的なfor文の書き換え方みたいなことでも良いので、教えて頂けませんか?宜しくお願いします。

  • 実験回数の決め方

    ある実験をこれから行おうとしているのですが、実験回数を決める方法などありますでしょうか。 統計学や計画法を調べたのですが、「異なる条件で実験するときに何回実験すればどちらの条件がいいか」などが載っており、今回の件に当てはまりませんでした。(ダッジ・ロミッグ解やMinimax解など) また、1バッチあたりの歩留まりがσ%だけ高くなったら利益がいくら上がるかという値bと、実験1反復当たりの損失aで表わされる、λ=a/bとなるλが推定困難な場合は8~10反程度が望ましいとありました。 この場合も8~10回程度はよいのでしょうか。 今回の場合、帯電量を求めるのですが、回数による問題は、帯電量の精度とかかる時間になってきます。どのくらい回数をこなせば測定平均値が帯電量が真の値に十分近づいたとみなせるか、です。 それとも実際やってみないと実験回数はわからないのでしょうか。 わかりにくい説明ですが、どうぞよろしくお願いします。

  • 実験精度の検定について

    熱電対温度計というものを用いて液体の沸点を測定する、という実験を行っているのですが、測定条件や環境を変化させた際に温度計の精度が変化します。温度計の精度が良くなった、または悪くなったということを論理的に言うために統計的な処理をしなければならないのですが、各測定条件におけるデータ群のどういった点を比較すればよいのでしょうか?標準偏差や平均値、有意差検定をどうのこうの・・・とするらしいのですがいまいちピンと来ません。誰かアドバイスお願いします。

  • 重複した数値の処理について

    実験で測定したデータの処理で困っています。 初めて質問させて頂きます。 取得したデータが重複しています。重複した箇所を適切に処理したいです。 各行の項目は次の通りです。 行A:時間 行B:分 行C:S 行D:HRV HRVとは心臓が鼓動する時の間隔時間(ms)です。(1回目のドックン!から2回目のドックン!までの時間) 間隔時間を測定しているため、一つの値(間隔時間)が2つの秒(S)をまたいで記録される場合もあります。つまり、同じ値が連続して記録されてしまっています。 2つ連続している値は一つに、3つ連続している値は2つに、というように処理したいです。 やはりマクロを用意するのでしょうか? もし良い方法があれば、この問題を修正したいです。 よろしくお願い致します。 *画像のデータは重複の削除を行い、データを見やすく編集しています。

  • 実験データの統計と検定でかなり困っています。

    植物の生長量を調べる実験を計画しています。 AとBの二つの処理区での生体重の変化を見る項目があります。播種して二週間後に、任意で20本を切り取り、生体重を測り、平均値を計算し、処理開始前の生体重とします。 (質問1.この20本のばらつきは標準偏差で表すべきですか、標準誤差で表すべきですか。) その後に、50本づつ条件が違うA区とB区に分けて栽培実験を行います。実験終了後に、この二つの区での生体重を測って、平均値を計算し、処理前の生体重と処理A区とB区での生体重がどのように異なるかを比べる実験です。 (質問2.両区それぞれのばらつきを見るには標準偏差を用いるべきですか、標準誤差を用いるべきですか。) (質問3.エクセルのツールバーを用いて、両区での結果が有意差があるかどうかを見るには、まず二標本を使った分散の検定を行い、分散が等しいかどうか見た上で、二標本によるt検定を行うということで何か問題ありでしょうか。)