• 締切済み

統計学初心者です!

統計学初心者です! わかりにく説明かもしれませんが、ぜひ、回答お願いいたします! 私は仕事で毎日あるサンプルAを分析しているのですが、会社の取り組みで 分析の頻度を減らそうと考えています。 そこで、統計学的な方法で根拠を確立し、上司に説明したいと考えています。 回帰式などいろいろ調べたのですが、最適な方法が分かりませんでした。 サンプルAについてですが、 ・ある成分が90%以上になるように管理しています。 ・分析は毎日行っています。 ・管理値以下の観測結果は月に一回ほど出ます。 ・分析値はすべてデータとしてまとめて保管してあります。 ・頻度を二回に一回くらいにしたいです。 どうかよろしくお願いします! .

みんなの回答

  • boseroad
  • ベストアンサー率26% (149/558)
回答No.2

しもた、1箇所訂正。 「許容できるかどうかの判断は上がすること」に差し替えて読んでな。「上がるすこと」とか、これでは意味分からへんやん、自分。(苦笑)

  • boseroad
  • ベストアンサー率26% (149/558)
回答No.1

分析をおこなう回数を減らしたい、いうことかね? 回数を減らればサンプル数が減るやんか。ほいだら、それだけ精度が下がることになる。同じ信頼度の信頼区間が広がるとか言うほがええかなあ。 あとは、下がった精度でも許容できるんかどうか。許容できるかどうかの判断は上がるすことやもの、あなたは許容して問題ないことを説明できる資料をそろえるとええやろ。 そしてそれは、もはやサンプルAに対する統計学的手法で説明できることではないわね。他のサンプルでの精度と比較してどうだとか、90%を若干超える程度にまで下がった場合に分析の回数を増やして補うことが考えられるとか、統計学をこえたアプローチが必要になるのと違うかな。

関連するQ&A

  • <統計>収量の要因がしりたいです。

    gooも統計についても初心者です。 統計手法についての質問です。 いま植物の花について勉強しています。具体的には植物体(葉や根の長さ)が花の数にどのように影響しているかを調べています。 そこで統計上どの要因(葉の枚数、葉の長さ、根の長さetc)が花の数に影響を及ぼしているか、どの要因が一番の影響を与えているのかを知りたいのですがどのような統計手法を使うのかがわかりません。 自分なりにですが主成分分析や重回帰分析などを統計ソフトなどにて試しては見たのですが、 主成分分析では全体に対する寄与率や第一主成分が出てしまい自分が欲しい「花の数」に対する数値ではないと思い断念しました。 重回帰分析でも第一要因が掴めませんでした。 統計的に「何をやってるの?」また「前にも同じ質問あった」などありましたらお叱りやURLの参照お願いいたします。 出来れば疑問に回答いただけたら幸いです。

  • 統計分析の方法について。

    独立変数、従属変数ともに質的な変数である場合に、 複数の因子から結果を予測するための統計学的方法に はどのようなものがあるでしょうか? 統計学の素人で統計学の本を片手にSPSSなどで統計処 理を行いたいと考えているのですが、どの方法を用い て処理をすればよいのかわからずに困っています。 質的変数を扱うのでロジスティック回帰分析かとも考 えたのですが、「ロジスティック回帰分析の場合、独 立変数は連続変数、従属変数が質的変数の時に用い る」らしい・・・ということで、ロジスティック回帰分析 もあてはまらないのかな、と思います。 どなたか統計学や医療分野での統計処理に詳しい方、 教えていただけないでしょうか。 よろしくお願いします。

  • 統計分析の方法と意味

    下記(1),(2)は5日ごとにA区とB区の値を示したもので、 A区とB区の間に有意差があるのかを調べたいのです。 時間的経過があるので単純に一元配置の分散分析では、おかしいと思い、単回帰分析を行ったところ、理解できない結果が出てきました。結果の意味が十分出来ていないのか、そもそもこのような分析に単回帰分析を用いること自体が間違っているのでしょうか。間違っているなら、正しい分析を教えてください。分析はエクセルで行っています(エクセル統計も入っています)。 統計について全く知識がありませんので、専門用語をあまり使わず、教えてください。 (1)A区 50.4,44.1,34.1,15.8   B区 67.5,46.8,39.5,16.6  一元配置の分散分析を行うと両区に有意差はない。  単回帰分析を行うと5%水準で有意差がある。 単回帰分析の結果は正しい気がする。 (2)A区 12.6,4.2,1.9,1.4   B区 12.0,5.9,2.0,1.0 一元配置の分散分析を行うと両区に有意差はない。  単回帰分析を行うと5%水準で有意差がある。 単回帰分析の結果は変な気がする(有意差がないのが正しいのでは)

  • 統計ソフトRの回帰分析について

    フリー統計ソフトRの回帰分析に関する質問です。 統計の研究でRというソフトを最近使い始めたのですが、なかなかうまくいきません。 特に、説明変数に期間を考慮した回帰分析のやり方です。 具体的には 二つの変数XとYがあって t期におけるYの値を過去6期間(k=1,2,3,...,6)のXの値で回帰させたいのですが (式)      6 Yt=A+ΣBkXt-k     k=1 どのような式をlm()に入れれば分析できるでしょうか? 

  • 統計:検定とシミュレーション

    統計:検定とシミュレーション 統計を勉強している途中で出てきた素朴な疑問です。 統計学においては非常に多くの検定方法がでてきますが、「正規性」だとか「等分散性」だとかさまざまな制約がありますし(勿論ノンパラ手法もありますが)、そもそもの仮説の立て方にも違和感を覚えます。 そこでなんですが、例えば、取得した400サンプルのテスト点数データの平均値が前回の同テスト点数の平均値70点より高いといえるか、などという場合に、母平均の検定など使わず、その400サンプルから無作為に200サンプル抽出して平均値を得る、そしてそれを1万回PCで反復処理させてその1万個の平均値の平均値をとって理論値である70点と比較する、なんていうやり方ではダメなんでしょうか?個人的にはこのほうがしっくりくるのですが・・・。 同様の考え方で、分散分析や重回帰分析などもできないものかと考えています。 見当外れのことをいっていたら恥ずかしい限りですが、ご教授願います。

  • PHPで統計分析を行いたいですが

    PHPで統計分析を行いたいですが、方法が見つからないです。 googleで「phpとR言語」で検索してみるとR言語で使う方法があるという記述はありまして、R言語のことを調べて見ましたがありませんでした。 PHPの関数でも幾つか簡単なものはありますが、他に統計結果を作り出す方法はありませんでしょうか。私がやりたいのは集計分析(カイ二乗)と回帰分析、多変量分析です。 よろしくお願いします。

    • 締切済み
    • PHP
  • 統計初心者です。助けてください

    介入研究をしました。分析方法で困っています。 Aグループ、Bグループという2つのグループを作りました(各20名)。 Aグループには、aという介入(運動プログラム)を行いました。 Bグループには、aに加え、bという介入(ごほうび)も行いました。 両グループとも、介入前、介入直後、介入1ヶ月後の3回、体力テストを行いました。 質問(1) Aグループに関して、「介入前、介入直後、介入1ヶ月後の3回における、aという介入による体力テストの変化」を調べるためには、どんな分析方法がよいのでしょうか。 質問(2) Bグループに関して、「介入前、介入直後、介入1ヶ月後の3回における、a+bという介入による体力テストの変化」を調べるためには、どんな分析方法がよいのでしょう((1)と同じ?)。 質問(3) Bグループは、Aグループと比べ、bという介入が加わっています。 介入以前に、AグループとBグループが似たような集団だということを確認するにはどうしたらいいんでしょうか。 また、bの効果を確認するためには、AグループとBグループ間でどのような分析をしたらよいのでしょうか。 質問(4) そもそも (1)~(3)のような視点で分析をすすめていてだいじょうぶでしょうか。 まずは、Aグループはどうなのか、Bグループはどうなのか、という視点で調べ、そして、AとBとではどうなのか、という視点で調べていけばいいんでしょうか。 統計初心者なもので・・・。 どうぞよろしくお願いします。おちから貸してください。

  • 【統計学】重回帰分析と正準相関分析の違いを教えてください。

    統計学初心者です。 文系でも分かる統計学といった類いの本を 読んでいるのですが、重回帰分析と正準相関分析の違いが分かりません。どうも同じように思えてしまうのですが・・・ 素人なので分かりやすく説明してください。

  • 統計学の質問です@

    統計学の質問です.一つの目的変数と複数の説明変数の重回帰分析で求まった決定係数が0.5より低いと目的変数と説明変数の間には相関関係がほとんどないということですか? あとt値は何を表しているのですか?

  • 統計的に必要なサンプル数

    ある素材からサンプルを採取し、成分(1種類)を分析して、分析値の標準偏差(3シグマ)を求めようとしています。 素材から採取できるサンプル数は、現実的に、最大で15点程度です。 成分量の3シグマを算出する場合、統計的に意味のあるサンプル数を求める考え方はあるのでしょうか。 数式的には、2サンプルから標準偏差の値は得られますが、2~3サンプル程度で、果たして意味のある標準偏差といえるのか、また、多ければ良いとしても、具体的に幾つなら良いのか、見当がつきません。 よろしくお願いします。