• ベストアンサー

「標本」と「標本点」の意味

「標本」と「標本点」という言葉の意味が分かりません。 (1)一般に「標本」と「標本点」は同じ意味だと思うのですが、これは正しいでしょうか。 (2)「共立数学公式改訂増補(共立出版1969)」p418には、要旨、「試行により現れる個々の結果を標本点または要素事象という」旨の定義があります。 一方、「チャート式数学C(数研出版)」p.165には、「本来調べたい対象全体の集まりを母集団、調査のために母集団から抜き出された要素の集合を標本という」とあります。 「共立数学公式改訂増補」には標本点は「個々の結果」とあるので、これは「標本点は1個の数値である」と言っているように思えます。一方、「チャート式数学C」には「集合を標本という」とあるので、これは「標本は複数の数値である」と行っているように思えます。すると、一方では1個であるとされ、他の一方では複数であるとされ、矛盾していると感じられるのですが、これはどう考えたらよいのでしょうか。同じ「標本」あるいは「標本点」という言葉が、場面によって異なる意味で用いられるということでしょうか。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • adinat
  • ベストアンサー率64% (269/414)
回答No.5

♯3です。 おそらく母集団に相当する確率論の用語はありません。母集団というのは統計独特の用語だと思います。前回の日本の家庭の預金高のモデルを例に再度簡単に説明をします。 簡単のため、日本には5家庭しかないとしましょう。それをたとえば{A,B,C,D,E}とすることもできますが、今の場合は預金高しか気にしていないのだから、たとえば{100万,1億,50万,200万,500万}としたほうがわかりやすいかも知れません。この場合、母集団={100万,1億,50万,200万,500万}です。ここから無作為に抜き出した2家庭の預金高を考える確率モデルを考えます。このとき、標本空間は{(100万,1億),(100万,50万),(100万,200万),(100万,500万),(1億,50万),(1億,200万),(1億,500万),(50万,200万),(50万,500万),(200万,500万)}の10個の2家庭の預金高の組と考えるのが妥当です。またもし1家庭の預金高を調べるというより単純なモデルであるなら、標本空間は母集団そのものと考えてもよいわけです。標本空間は考える確率モデルを変えると別のものになります。いずれにせよ今考えている確率モデルで、起こりうるすべての結果を集めたものが標本空間と考えていて問題ないと思います。 いくつか値の決まっているデータがあって、そこから抽出を行うという行為は確率モデルにはなりますが、データそのものを何の工作もしないのであれば、それはなんらランダムネスはないわけで、したがって確率論では母集団そのものには何の興味もないんですね。(少し余談ですが、母集団の平均(母平均)とか母集団の分散(母分散)とかを統計では気にしたりしますが、これらは確率変数の期待値や分散とはまったく異なるものです。ところが母集団から何かサンプルを一つ抽出するというランダムな操作をしたときの得られる値(それはランダムなのだから確率変数である)の期待値や分散というのはいわゆる確率論の期待値、分散そのものなのです。そして抽出が無作為である(一様分布に従って抽出する)とき、それらが母平均、母分散に一致するんですね。ややこしければここに書いたことは無視してください) (強引に意味づけするとしたら、上にも書きましたが、母集団とはただひとつだけを無作為抽出する確率モデルの標本空間のこと、と解釈してもよいかも知れません。)

yoohoo_7
質問者

補足

前回の御回答( http://oshiete1.goo.ne.jp/kotaeru.php3?q=2335158 )で「「標本空間」と「母集団」はまったく別の意味で使われている」とおっしゃった意味がやっと分かりました。本当に、自分でもあきれかえるのですが、前回の御回答は高度すぎて充分には理解できていなかったと思います。 「いくつか値の決まっているデータがあって...」の段落も自分なりにはよく分かりました。私の知識の曖昧だった点をピンポイントで御指摘いただいたような気がします。有り難うございます。 2度の質問を通じて多くのことをたいへん明確に御教示いただきました。厚く御礼申し上げます。有り難うございました。

その他の回答 (4)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

 過去に質問回答の経緯があったとは知りませんでした。根が深い話だったんですね。  現実の用語としては、「標本」と「標本点」をはっきり区別してはいない。回答No.3でadinatさんがご指摘の通り、元々同じ概念なんでしょう。(ただ、順番がついているn個のデータの列x[1], x[2], … x[n]を1個のベクトルと見て「標本点」と呼ぶのは自然ですけれども、順番がない単なる「データの集合」を「標本点」と呼ぶことはないんじゃありませんかね。)  「標本」と「標本点」にはっきりした区別はないけれど、しかし、同じひとつの文章の中でごっちゃにするのだけは断然駄目です。たとえば『「標本点」を一個のデータを指すのに使う』と決めたら、標本点を「標本」と呼んだり、標本点の集合を「標本点」と呼んだりすると、文章のconsistency(首尾一貫性)が破綻してしまい、意味不明になってしまいます。  で、ご質問の文章はと言うと、別の文章(1)(2)を持って来てごっちゃにしてみたのに、(1)(2)の間に何の矛盾も生じていない。両者はconsistentであり、きちんと意味が通じています。(No.2はこのことを説明しています。)  だからご質問の文章は、矛盾がない実例を示して「ほら見ろ矛盾しているぞ」と主張していることになります。実例がご主張の根拠になっておらず、このためにご質問の文章全体が首尾一貫していない。(論理学の観点からちょっと興味深い事例です。)このことを、回答No.1が指摘しています。

yoohoo_7
質問者

お礼

>現実の用語としては、「標本」と「標本点」をはっきり区別してはいない。 そうなんですか。やはり、はっきりとは区別されないんですね。 >「標本」と「標本点」にはっきりした区別はないけれど、しかし、同じひとつの文章の中でごっちゃにするのだけは断然駄目です。 それは、よく分かります。 >だからご質問の文章は、矛盾がない実例を示して「ほら見ろ矛盾しているぞ」と主張していることになります。 確かに、そのような主張になります。やっと分かりました。 有り難うございます。

  • adinat
  • ベストアンサー率64% (269/414)
回答No.3

前回の回答は納得いただけなかったのでしょうか。 前にも書きましたが、もともと確率論の言葉では、「標本」も「標本点」もまったく同じものを指す用語で複数の呼び方があるだけのものです。これを統計で流用して、若干異なるニュアンスになっているようですが、次のように解釈すれば同じだと見られるのです(前回も書きました) つまりn回の試行を行ったときに得たデータの組X=(x_1,X_2,…,x_n)(復元でも非復元でも構わない)をひとつのベクトルと見て、これを確率ベクトル(確率変数の多次元版)だと思うわけです。そうすればこれは一つの標本です。また標本は複数の数値などと書かれていますが、標本が1点になることもあります。1個だろうが、複数だろうが、あるいは無限個あろうが、それがランダムに選ばれるものであれば、それを標本(標本点)と呼ぶのです。 チャート式の標本の説明は鵜呑みにしないほうがよいと思います。不用に混乱するだけです。共立の説明のほうがより真実に近いでしょう。ただこれはどこの世界でも起こりうることですが、言葉の意味を本来のものとは異なる意味にとって用いたりすることはよくあります。そういう意味では、場面によって異なる意味で用いられる、といってもいいですが、私はチャートの理解などは誤った解釈と感じますけれど。 やや抽象的で恐縮ですが、確率論での正式な言い方は次のようになります。 (Ω,F,P)を確率空間、Xを完備可分距離空間(S,σ(S))に値を取る確率変数とするとき、ω∈Ωを標本、標本点、見本、などという。 この言い方だと確率変数Xがなくても標本などの用語が定義できそうですが、確率変数がないとあまり標本という意味がないのです(たんなる抽象的な集合Ωの元ωを指すだけだから)。標本というものが実態を持つのは確率変数Xが与えられたときの話です。また統計で使うときは、Ωは基本的には母集団に取ります。また確率変数Xは母集団からのサンプル抽出を行うもの(通常は一様分布に従う確率変数と解釈します)とすることが多いです。ただし統計をやるときはあまりこの確率空間、確率変数を意識することは少ないです。というのは、確率空間がきちんと意味を持つようなものだからです。 余談ですが、たとえばサイコロを1回投げるモデルでは確率空間は通常{{1},…,{6}}からなる6点集合を取りますが、サイコロ2回投げるモデルでは{{1},…,{6}}×{{1},…,{6}}というものを取ります。つまり直積空間です。ここでのサンプルというのは二つの数からなる組、たとえば(2,5)とか(6,6)とかですが、これを複数の数値だとは思わずに、一つの数値(ベクトル)だと思え、というような話なのです。

yoohoo_7
質問者

補足

再度の御回答、有り難うございます。 自分ではだいぶん分かってきたつもりなのですが、何分素人のためどこまで分かっているのかがはっきりしないのがつらいです。 後1つお尋ねしてもよいでしょうか。 前回の質問で上げた例ですが、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高を考えた場合には、100家庭の預金高が標本空間であるというのはよく分かりました。このとき、「日本の全家庭の預金高という母集団」は、確率論では何と(例えば、「○○空間」のような言い方をすると)言うのでしょうか。 よろしくお願いします。

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

● 「調査のために母集団から抜き出された要素の集合を標本という」のだから標本とはひとつの集合Xです。 ● 一方、「試行により現れる個々の結果を標本点または要素事象という」のだから標本点はひとつのデータxです。 さてこの場合、「本来調べたい対象全体の集まり」とは実は<あらゆる試行の集まり>であり、これが母集団です。そして、「調査のために母集団から抜き出された要素」とは、「試行により現れる個々の結果」のこと、つまり標本点xです。  だから、「調査のために母集団から抜き出された要素の集合」とは「標本点xの集合」に他ならず、これを標本Xと言うんですから、 x∈X  標本Xと標本点xを混同しさえしなければ、何事の不思議もありません。

yoohoo_7
質問者

お礼

そうなんですか。 標本と標本点は違うんですね。やっと分かりました。 有り難うございます。

noname#210617
noname#210617
回答No.1

『「標本」と「標本点」は同じ意味だと』仮定すると、 『矛盾していると感じられるのです』なら、 「仮定が間違っている」と感じられるのですが?

関連するQ&A

  • 共立数学公式改訂増補の文字の名前と読み

    共立数学公式改訂増補(昭和43年12月15日 泉ほか 共立出版)の420ページの上から4行目に、 2. ○がα-集合体であるとき... とありますが、この「○」の位置にある文字の、名前、読みを教えてください。 それと、もし分かれば、これは何語の文字なのでしょうか。 よろしくお願いします。

  • 標本、標本点、標本空間

    次の言葉は、通常、概ね次のように定義されていると思います。 (1)標本:統計において、母集団から抜き出した要素の集合。例えば、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高。 (2)標本空間:標本点全体の集合。例えば、1個のさいころを1回投げたときに出る目の数の集合{1, 2, 3, 4, 5, 6}。 (3)標本点:試行の結果生じ得る1つひとつの現象。例えば、1個のさいころを1回投げたときに出る目の数。{1}、{6}など。 これに関連して次のQ1、Q2についてお教えいただけないでしょうか。 Q1:「標本」は母集団からの抽出の話であり、「標本点」は試行の話です。「標本」と「標本点」とは、たった1文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。 Q2:「標本」は抽出したもの(つまり、一部分)の話であるのに、「標本空間」は試行の結果の全体(つまり、全体)の話です。。「標本」と「標本空間」とは、たった2文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。 そもそもの疑問は、「標本点」と「標本」は1文字違うだけなので、「標本点」の定義は「標本」という言葉を用いて定義できるのではないかと思ったことにあります。例えば、「預金高」と「預金」は1文字違うだけなので、「預金高」は「預金の金額」のように「預金」という言葉を用いて定義できるようにです。 これらは全く異なる概念だと言われれば観念して覚えますが、何か腑に落ちないのです。

  • 写像と変数

    共立出版の「共立数学公式」の419ページに次の『 』内のような記述があります。 『確率空間を(Ω, P), Ω={ω1, ω2, …, ωn, …},P={p1, p2, …, pn, …}, pn=P(ωn) とする。実数列{xl}={x1, x2, …, xl, …} に対して Al={ωn; X(ωn)=xl}<ΩとするときP(Al)=plがΣP(Al)=ΣP(X=xl)=Σpl=1を満たすなら, このΩから{xl}への写像X=X(ω)を離散的確率変数といい, (xl, P(X=xl))≡(xl, pl)をXの確率分布, plを確率密度という.』 (注. 上記『 』内は「共立出版の「共立数学公式」の419ページから引用させていただきました。) この記述が理解できないのでお教えいただきたいのですが、本来なら著者の方にお教えを乞うべきと思いますが著者がご高齢でありそれもかないません。もしおわかりの方がおられましたらお教えいただけないでしょうか。 私は次のように思っています。 「写像」は「集合Aの要素に集合Bの要素を対応させる関係」というような意味であり、一言で言うと「関係」だとおもいます。 「変数」は「様々な値を取り得る量」というような意味であり、一言で言うと「量」だと思います。 しかし、上記『 』内には「写像X=X(ω)を離散的確率変数という」とあります。これは一言で言うと「写像を変数と言う」という意味だと思います。 それで、ここからが疑問点なのですが、上記『 』内ではなぜ「写像」と「変数」という全く異なった性格のものを等しいとしておられるのでしょうか。 上記『 』内の文の意味を理解したのですが、上記の疑問点が解決されなくて『 』内の文の意味を理解できないような気がしています。あるいは、私の『 』内の読み方が間違っているかもしれないのですが...。 素人の質問で申し訳ありません。また、他の方がお書きになった書物についての質問で申し訳ありません。もしお分かりになりましたら、よろしくお願いします。

  • 同一分布とは何でしょうか

    急に中心極限定理を勉強することになり、共立数学事典改訂増補を見たのですが、その429ページの「4.中心極限定理」の項の2行目に「...同一分布に従い...」とあります。「同一分布」とは何でしょうか。 当方、高校で微分、積分を勉強したくらいで、数学は全くの素人です。確率、統計は全く勉強したことがありません。 よろしくお願いいたします。

  • 東工大向け参考書

    東工大を目指しています。数学・化学(物理)・英語の参考書についてご意見を賜りたいと思います。 今持っている本 【数学】青チャートI+AとII+B 【英語】実力強化問題集英文法(文英堂)システム英単語 【化学】トライアル化学I改訂版(数研出版) 買うことを視野に入れている本 【数学】青チャートIII+C(赤チャートも検討中)・大学への数学・一対一 【英語】何を買えばいいのかわからないのでとりあえず速読英単語必修編を検討中(Z会) 【化学】トライアル化学II改訂版(数研出版) 【物理】トライアル物理IとII改訂版(数研出版) これをご覧になって思ったこと感じたことや何に気をつけて参考書を使うべきかを聞かせてください。 そして、東工大は青チャートで対応できるのかも気になっています。(できれば青チャートでやりたいのですが)ですので補助として大学への数学、一対一と呼ばれている本が有力なようなので挙げてみましたがどの本かがわかりません。1対1対応の演習/数学I―大学への数学 (1対1シリーズ)のシリーズでよろしいのでしょうか。 御回答お願いいたします。

  • 集合の対称差について質問です。

    大学で離散数学を勉強したので、もっと詳しく勉強するために、 マグロウヒル出版 コンピュータサイエンスのための離散数学入門 という本で勉強しております。 その中で分からない点がありましたので教えていただければと思います。 対称差のところで、 「P1⊕P2⊕・・・⊕Pk は集合P1, P2, ・・・, Pkのうちの奇数個の集合に含まれている要素の集合であると定める」 と書かれていました。(⊕は環境依存文字なので表示できているかわかりませんが、○の中に+がある、対称差の記号です。) これの意味がわかりません。 分かる方教えてください。 よろしくお願いします。

  • 確率の意味

    共立出版の「共立数学公式」の419ページに次の『 』内のような記述があります。 『確率空間を(Ω, P), Ω={ω1, ω2, …, ωn, …},P={p1, p2, …, pn, …}, pn=P(ωn) とする。実数列{xl}={x1, x2, …, xl, …} に対して Al={ωn; X(ωn)=xl}<ΩとするときP(Al)=plがΣP(Al)=ΣP(X=xl)=Σpl=1を満たすなら, このΩから{xl}への写像X=X(ω)を離散的確率変数といい, (xl, P(X=xl))≡(xl, pl)をXの確率分布, plを確率密度という.』 注1. 上記『 』内のうち、<は集合の「含む」の記号です。lは「を満たすなら」の前のそれは数字の「いち」であり、それ以外は全て小文字の「エル」です。また、「2つ続くアルファベット」または「2つ続くアルファベットと数字」のうち右側の文字は下付き文字です。いずれもどのように入力してよいのか分からないので、上記のように入力させていただきました。 注2. 上記『 』内は「共立数学公式(泉信一ほか 1977)」の419ページから引用させていただきました。 この記述が理解できないのでお教えいただきたいのですが、本来なら著者の方にお教えを乞うべきと思いますが著者がご高齢でありそれもかないません。もしおわかりの方がおられましたらお教えいただきたいのですが。理解できない点は次の(1)~(3)です。 (1) Al={ωn; X(ωn)=xl}のωnは、「n番目のω」というただ1個のωを表しているのでしょうか、それとも「X(ωn)=xlという条件に合致する全てのω」を表しているのでしょうか。 (2) X(ωn)=xlは、「n番目のωであるωnの写像であるX(ωn)はl番目のxであるxlに等しい」という意味でしょうか。 (3)(xl, P(X=xl))≡(xl, pl)は、(xl, P(X=xl))=(xl, pl)と同じ意味でしょうか。 素人の質問で申し訳ありません。また、他の方がお書きになった書物についての質問で申し訳ありません。もしお分かりになりましたら、よろしくお願いします。

  • 稠密について、集積点(触点)、閉包って何ですか?

    http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14133159999 上記URLのベストアンサーの回答より下記引用します。 ーーーー引用しますーーーー  (3)稠密  集合Pの集積点(触点)をすべて付加した集合をPの閉包とい  う。Pバーであらわす。稠密とは、P⊂Q,Pバー⊃Qのとき、P  はQで稠密であるという。 ーーーー引用終わりーーーー 1がある。 1の次のものがあって、それは2である。 2の次のものがあって、それは3である。 3の次のものがあって、それは4である。 4の次のものがあって、それは5である。 5の次のものはない。 集合Q Q={1,2,3,4,5} 集合P P={2,4} 集合R R={2,3} PはQで稠密でない。だって、間があるから。間は3です。 RはQで稠密である。だって、間がないから。 とするとき、集積点(触点)や閉包が分からないです。 集積点(触点)や閉包はどうなりますか? Pの要素の2のQでの両隣の要素は集積点(触点)で1と3。 Pの要素の4のQでの両隣の要素は集積点(触点)で3と5 Pの閉包をPバーと呼ぶ。 Pバー={1,3,5} Pバー={1,3,5}⊅Q={1,2,3,4,5}   Qの要素の2と4が余るのでQはPバーに含まれない。 P={2,4}⊂Q={1,2,3,4,5}     Pの要素が余らないのでPはQに含まれる。 PはQで稠密でない。 間があるから。 Rの要素2のQでの両隣の要素は集積点(触点)で1と3。 Rの要素3のQでの両隣の要素は集積点(触点)で2と4。 Rの閉包をRバーと呼ぶ。 Rバー={1,2,3,4} Rバー={1,2,3,4}⊅Q={1,2,3,4,5}  Qの要素の5が余るのでQはRバーに含まれない。 R={2,3}⊂Q={1,2,3,4,5}     Rの要素が余らないのでRはQに含まれる。 RはQで稠密でない。 間が無いから。 稠密であることと間が無いことが合致してほしいのだが、すっき りしないです。 ⊂と⊆は同じ意味とする。 ⊂と⊊は違う意味とする。 ⊂は部分集合の意味とする。 ⊆は部分集合の意味とする。 ⊊は真部分集合の意味とする。 ⊄と⊈は同じ含まれない、真部分集合でなく、かつ、部分集合で もない。という意味とする。 稠密について、集積点(触点)、閉包って何ですか? 分数をたくさん用意しないとうまくいかないのではなかろうか? 分数をたくさん用意しても、間があるのを言うのは簡単そう。間 は1/2ですって言えそう。 分数をたくさん用意すると、間がないのを言うのは難しそう。ぜ んぶそろってるのかな?

  • 標準偏差について

    エクセルで、標準偏差の式は4種類あり (STDEV、STDEVA 、STDEVP、STDEVPA) 違いがよくわかりません。 はじめの2つは分母が(n-1)、あとの2つは分母がn となっています。 高校の数学で習ったときは、分母はnだったと思います。 この違いはなんですか? (2つずつ同じ数式ですが、Aがあるのと無いのでは何が  違うかわかりますか?) エクセルのヘルプでは、下記のように書いてあります。 STDEV 引数を正規母集団の標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します。 STDEVA 数値、文字列、および論理値を含む引数を正規母集団の標本と見なし、母集団の標準偏差の推定値を返します。 STDEVP 引数を母集団全体と見なし、母集団の標準偏差を返します。 STDEVPA 数値、文字列、および論理値を含む引数を母集団全体と見なし、母集団の標準偏差を返します。

  • 有限母集団の中心極限定理

    訳あって確率統計の勉強をしておりますが、中心極限定理について質問があります。 「母集団の平均をm、分散をvとすると、そこから抽出したn個の標本の平均の分布は、平均m、分散v/nという分布になり、標本数をn→無限大とすると、分布は母集団の分布によらず正規分布に近づく。」 とありますが、母集団が有限個(N個)の集合ならどうなるでしょうか。 その場合、標本数をnがNに等しくなった時点で平均はm、分散0、つまり標本から母集団の平均が完全に推定(決定)することになります。 ●有限母集団の場合も中心極限定理は成り立つのか? ●成り立つならn→Nで分散が0になるという点はどう表現されるのか? このあたりを教えてください。