• ベストアンサー

調査。各グループの代表の決め方。

宝来聡著「DNA人類進化学」(岩波書店)から引用しています。 下の表は「クラスターの構成と地理的分布」を書き写しています。 各数字は左から、 静岡、沖縄、北海道、韓国、台湾の人数を示しています。 それを元に各クラスターはどの民族に特徴的かを、「特異性」として、 日本人、琉球人、アイヌ、韓国人、中国人の中から決めています。( )内の数字はただの番号です。 「特異性」 アイヌ(1) 1,0,10,1,1 中国人(1) 11,4,1,5,13 琉球人(1) 0,3,0,0,1 中国人(2) 4,1,1,4,15 韓国人(1) 7,4,4,14,2 ―――(1) 5,5,2,3,5 ―――(2) 2,5,3,1,5 日本人(1) 3,2,0,0,1 中国人(3) 1,0,3,4,6 韓国人(2) 5,0,1,7,1 ―――(3) 5,1,4,5,1 ―――(4) 1,2,3,3,1 琉球人(2) 3,5,0,3,3 韓国人(3) 3,0,0,5,4 琉球人(3) 5,12,8,5,0 アイヌ(2) 4,1,7,0,0 琉球人(4) 2,5,4,3,1 中国人(4) 0,0,0,1,6 本文にはこの特異性の決め方は恣意的な面があると言うような断りの一言も書かれています。 特異性とは言うものの代表を決めているだけだと思います。生物学その他の要素がないものとして、単純に数字だけみて、特異性の決め方に妥当性がありますでしょうか。たとえば直感的にアイヌ(1)は許せますが、中国人(1)としたクラスターは納得できません。11人の日本人(静岡)は、中国人の特異性に含まれた事になります。 統計学などで、代表を選ぶような手法がありますか。その手法で判定すると上記の特異性は適切でしょうか。 皆さんが処理しなければならないとしたらどうしますか。 宜しくお願いします。 ちなみに、この数字から日本人は他の民族のいわば混血というような話題に発展しているようです。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 「代表を選ぶ」という話ではどうもないようで、むしろ「各クラスタの特徴を離散的に表現する」というような話かと思います。  ご質問の表の第i行第j列をx[i,j]と書く事にします。クラスタi (i=1~18)のタイプjの人の数がx[i,j](j=1~5)ということです。  これだけしかデータがないので、しょうがないから(絶対的な基準ではなく)ここに挙げられている18のクラスタだけを見て、それらの相互比較で「特異性」を言ってみることにします。もちろん、これが適切かどうかは「クラスタ」だの「特異性」だのの意味を正確に知らねば判断できませんが。  さて、jごとに、またiごとにも構成人数が異なるようなので、これを規格化すべきです。   t[j] = Σ{i=1~18}x[i,j]   T = Σ{j=1~5}t[j] として、各jの構成比率   m[j] = t[j]/T を計算します。これが、ここに挙げられているクラスタにおける、平均的な構成比率(クラスタをランダムに構成したときの期待値)である、と考えて良いでしょう。  各クラスタにおける実際の比率y[i,j]は   s[i] = Σ{j=1~5}}x[i,j]   y[i,j] = x[i,j]/s[i] なので、yからmを差し引いた   z[i,j] = y[i,j] - m[j] を作ります。  実際やってみたら、こうなりました: -0.13 -0.17 0.60 -0.14 -0.15 0.11 -0.05 -0.14 -0.07 0.16 -0.21 0.58 -0.17 -0.22 0.02 -0.05 -0.13 -0.13 -0.06 0.37 0.01 -0.04 -0.05 0.23 -0.16 0.04 0.08 -0.07 -0.07 0.02 -0.09 0.14 0.01 -0.16 0.09 0.29 0.16 -0.17 -0.22 -0.06 -0.14 -0.17 0.04 0.07 0.20 0.15 -0.17 -0.10 0.28 -0.15 0.10 -0.11 0.08 0.09 -0.16 -0.11 0.03 0.13 0.08 -0.13 0.00 0.19 -0.17 0.00 -0.01 0.04 -0.17 -0.17 0.20 0.11 -0.04 0.23 0.09 -0.05 -0.23 0.12 -0.09 0.41 -0.22 -0.23 -0.08 0.16 0.09 -0.02 -0.16 -0.21 -0.17 -0.17 -0.08 0.63  z[i,j]は数値が大きいほど、「クラスタiは、デタラメにクラスタを作ったのに比べて、タイプjの人が多目に入っている」ということを意味しています。そこで、各クラスタiについて、z[i,j]が最大になるjをJ[i]としますと、J[i]は、ま、おおざっぱに言えばですが、「クラスタiで特徴的に多いタイプの人」を表しているでしょう。  (もちろんもっと手の込んだ手法はいくらもありますが、そうすると「クラスタnは日本人が多い」のような単純な答にはならず、複雑な(たとえば「韓国人と中国人の人数の差と日本人の人数の1.2倍との和が大きい」みたいな)特徴量が現れてきますから、ご質問の文脈には沿いません。)  で、J[i]をご質問にある表と比べてみると、面白い事に、「---」になっているところ以外は全て、J[i]と「特異性」とが一致しました。  というわけで、いやもちろん、これが適切な「特異性」の計算法だと主張できるほどの根拠はない。けれども、ごく穏当な素朴で統計的にも尤もそうな処理を加えただけであって、特別細工をしたわけでもないのに同じ結果が出てきたんですから、ご質問の表は「断然妥当でない」とまでは言えない、という程度にソコソコマトモだと思われます。

thegenus
質問者

お礼

回答者:stomachmanさん。質問者のレベルに配慮されたご回答ありがとうございます。とても分かりやすかったです。 >『ご質問の表は「断然妥当でない」とまでは言えない、という程度にソコソコマトモだと思われます。』 私としては本件において、最大値のものを、単純に、代表になると決めていいのか?という点が疑問です。やはり統計的にも問題ではありませんかね。 stomachmanさんは、個人的には、このクラスターの代表の決め方を認められますか(笑)? 調査の結果と言っても、もちろんそれはサンプルですので、AになることもあればBになることもありますので、どちらも代表になりえる蓋然性がある場合に、どちらかを代表にして、話を進めるのは、誤謬のある論証になり、棄却されると思うのですが。つまりは、あるサンプルの結果に大小があっても、そのサンプルにおける大小が、”デタラメ”のうちにあるかどうかを統計学的に吟味するものですよね。 中国人(1)のクラスターでは、「日本人」0.11と「中国人」0.16ということから、そのクラスターは、「中国人」であり、「日本人」ではない、としてしまうのはどうなのでしょう。その時点で論理が崩壊していませんでしょうか。 当該の書物はこのクラスター中国人(1)として文章を進めてしまっていますが、(この具体的数値を掲載している点はカナリマトモな筆者なのですが、)この中国人(1)のクラスターが日本人でもあり中国人でもありという判定に変わると、この著作の説得力が大分揺らいでくるような気もしています。 今回、ご面倒な計算をしていただいた上にその具体的数値までご提示くださり、stomachmanさんのご親切さに深く感謝しております。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (11)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

ANo.1のコメントについてです。  お示しの数値の出自も目的も分からないので、統計的にどうこうしたくても、必要なモデルが未知ですし、モデルを憶測ででも構築するための情報すら未知です。ご質問の文面から、「遺伝学的な意味で『単一民族・日本人』というものが本当にあるのかどうかを論じるためにミトコンドリアのSNPs解析で母系をたどる」みたいな話か?とも思うのですが、しかしそんなデータなら莫大に取られている。仮に、独自のプロトコルでサンプルを選んで調べ直したという話だとしても、特定の少数のSNPsについて調べるだけなら大した設備も費用も要らない。どちらにせよ、表の数値が単なるサンプル数だとすると異様に小さいのがなんだか腑に落ちません。もしかして、何か別のことを表す数値じゃないだろうか、とも考えましたがこれも分からず、いやそもそもグループに分けてある意味ががさっぱり不明。というわけで結局、一体何をどうまとめたらこういう表になるんだか想像し難く、また県名と国名が並んで出て来る奇妙さも説明できず、いやはや、お手上げです。なので、ご質問の表に恣意的な確率モデルを適用するのは不適切だろうと考えました。  ところで、もし、ご質問にある本が強い影響力を持っていて、しかもその本が明らかな統計学的誤りを含んでいる、ということであれば、その本(か、あるいは元になっている原著論文)を検証・批判した論文ぐらいどっかにありそうなものです。

thegenus
質問者

お礼

早速のご回答ありがとうございます。stomachmanさんならば5分で読める本だと思いますので話のネタに一読いかがですか。 非数学領域の吟味を加えて慎重になられることはないと思います。私は一読したですが、数値に関しては、深読みする必要のない、人数そのまんまの数字です。 数学・統計学に処理をする場合、出自がなんであれ、いずれにしても、単なる数字の羅列として扱う訳ですので、数学家的・統計的に、妥当性のある「”代表”選び」になっているかをご検討していただきたいのです。つまりはこのデータが何のデータであってもいいのです。 親切なstomachmanさんのせっかくのご指摘にすぐにお応えできる環境にないので、取り急ぎ、下手な検索をかけてみました。 『ミトコンドリアDNAの可能性と限界・9 クラスター分析を見るときの注意』から抜粋。 >『静岡、沖縄、北海道、韓国、中国からそれぞれ50~66のサンプルを集めて、MtDNAのDループのパターンを調べて、それの近似度を系統図にまとめたところ、18のクラスターに分類できた。各クラスターにおいて何人が一番多いかを調べ、そのクラスターの「特異性」だ、と名づけた。例えばクラスターC2には、静岡人11人、沖縄人4人、アイヌ0、韓国人5人、中国人13人が入っていたので、このクラスターの特異性を「中国人」と名づけた、というものだ。 そういう定義であるから、たまたま、C6の場合だと、日本人5、沖縄人5、アイヌ2、韓国人3、中国人5、が入っているので名づけようがなく特異性の欄には「---」と書いてある。 さて、このクラスター、群、グループの中に属する人たちはどれほど近縁なのだろうか。同じクラスターに属していても、DNAパターンが全く同じ人たちもあれば、トーナメント試合の組み合わせ表のような線を辿ってみると、5乃至6段のレベルを移動しないと、共通の母に行き着かない人もある。もし、この図で、レベルが一段違うことが少なくとも塩基一つの違いと考えれば、それは平均12,000年の経過に相当するというから、5~6段の違いは6~7万年以前まで遡れば共通の母に到達する。そういう人たちの群なのだ。 』(引用終わり) http://www.dai3gen.net/mt09.htm http://www.dai3gen.net/mtdna.png >『 ところで、もし、ご質問にある本が強い影響力を持っていて、しかもその本が明らかな統計学的誤りを含んでいる、ということであれば、その本(か、あるいは元になっている原著論文)を検証・批判した論文ぐらいどっかにありそうなものです。』 個人的意見ですが、その因果関係は日本では成立しないと思います。権威者の稚拙さを指差しする論文言論は日本に存在しないでしょう。 それは研究者の好き好きに任せるという恣意的設定は、その流れに逆らわずに読み進められる部分でしょうが、その設定が非統計的なものであれば、独善の展開です。「これは私が恣意的に設定した」と断りの一文を入れたら、詐欺ではなくなりますので(筆者はそうしているので不義の無い著作なのですが)、設定の吟味を忘れたまま、大きな話題が形成されっぱなしなのだと私は思います。 この話題は、大風呂敷の権威と、早ガッテンのシモジモが生んだ小説に見えます。 ★単なる数値としてご検討いただけるだけで十分ですので宜しくお願いします。最初からそのつもりで数学カテを選びました。 ★たとえば、二者の間に有意差が認められる事と、二者のうち大きい方を代表に選べる事は、別の説明が必要になると思うのですが。 ここも、stomachmanさんのような、質問者の疑問解決に専心する、まっとうな回答者ばかりになれば、質問者も質問サイトも要らぬ苦労をしないでしょう。多くの二心のある回答者の投稿が質問サイトをガサツな落書き場にしむけていると思います。幻滅気味だったサイト参加者として非常に救われました。ありがとうございます。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 琉球文化とアイヌ文化の違いはどこにあったのでしょうか?

    北海道も沖縄も、元々は日本ではありませんでした。 共に日本に吸収された本土とは異なる民族という特徴を有しますが、北海道と沖縄には根本的に異なるものがある気がします。 まず、沖縄の方言である沖縄弁は琉球語をほぼ引き継いだ形となっています。沖縄の風習も琉球王国時代の風習が色濃く残っており、食文化などに流暢に現れています。このように、沖縄の文化には琉球王国時代の名残が大きく残っていると思います。 ですが、逆に北海道の方言はアイヌ語を引き継いでいるわけではありません。本土から移住してきた和人の言語を引き継いでいるために、他の地域と比べて特異性がある方言というわけでもありません。これは風習や文化でも同じです。沖縄の文化がネイティブから引き継いだものであるのに対し、北海道の文化はネイティブから引き継いできたものではありません。 この違いは一体何なのでしょうか? また、北海道民には混血を含めてアイヌはそんなにいないように感じられます。逆に沖縄県民における琉球人の割合は大半を占めるように感じられます。 この違いは何でしょうか?それとも私の気のせいですか?

  • 中国が過去の日本のアイヌや琉球政策に学べない理由

    独立を認めない方向で動くにしても動き方というものがあると思います。 日本の琉球やアイヌ対策、占領地の諸民族に対する皇民化政策のような平和で健全で平等な同化政策があるということが中国では知られていないのでしょうか。 世界史の授業が日本では必須でありますが、中国では時刻の歴史こそが世界一であり他国の技術や手法は劣ったものと考えられているのでしょうか? チベット対策で中国が人権重視でかつ独立を認めずかつチベットと今後も仲良くやっていくというような行動に出ない理由を教えてください。

  • どうして中国は日本の少数民族政策を見習わない

    日本ではアイヌや琉球民族の文化や人権は保護されていますし、 彼らが望めば彼らの言葉で高等教育を受けることすら可能です。 集会や言論自由が法律によって保障され運用もそのとおりである日本において、 戦後何十年もたちましたがアイヌや元琉球のひとたちが日本政府に対して不満を漏らしたことは一度だってありません。 デモも一度も起きたことがありません。 アジアで最も成功しているのではないでしょうか。 中国が中華思想を改め、 たとえ日本そのものは嫌いなままだったとしても、優れたところだけは認める、見習うのはいつごろになりますか?

  • 琉球民族は存在しますか?

    ニュースで、国連のB規約人権委員会が「琉球民族」を日本の先住民族と認め「アイヌ民族」と共に必要な措置を取るよう日本政府に勧告して来たそうです。 それで質問なんですが、「琉球民族」とは存在するのでしょうか? 私自身も良く分からないのでお願いします。

  • 「アイヌ民族」は存在しないので「アイヌ差別」も存在しないのでは?

    「アイヌ民族」は存在しないので「アイヌ差別」も存在しないのでは? 日本は単一民族国家です。 以前、「北海道ウタリ協会」が「北海道アイヌ協会」に改名して、 少しだけ話題になりましたが、現在日本には「アイヌ民族」なる 民族は存在していなく、この団体とはアイヌ民族の子孫の人達による 趣味のサークルの様なものらしいです。 なお、ここでは詳しく書きませんが、この団体に所属していると 生活上の色々な特典を受けられる制度もあるみたいです。 彼らは日常生活においては、日本語を話し日本食を食べて、日本の 学校を卒業した完全なる「日本人」と言えます。 ちなみに私は札幌市の者です。 この「アイヌ民族」存在に対し、道外の方々はまるで在日韓国人の ような存在に考えているような節を感じますが、何か違うような気が します。 アイヌは主に白老・平取・阿寒等に古くからの集落を有しておりますが、 それは大阪市における鶴橋の韓国人街のような地域とはちょっと違います。 ちなみに札幌市に「アイヌ居住区」はありません。 (聞いた事ないので多分無いでしょう) あと、私は札幌生まれ札幌育ちですが、アイヌだと言う人を見た事が ありません。 また、「アイヌ差別」というものも存在しません。 例えば、知り合いが「実は俺…韓国人なんだ」と言うのと 「実は俺…アイヌなんだ」と言うのでは受け止め方が全く異なります。 「韓国人」である事に対しては色々と思う事もあるかと思われますが、 アイヌにである事をカミングアウトしても特に何も無いでしょう。 アイヌは徒党を組んで悪行を働いたりはしませんし、 パチンコ屋等の一部の産業を牛耳っていたりもしません。 ですから、むやみやたらにアイヌに対して、「かわいそうな民族」として 見るべきではありません。 仮に学校や職場で「アイヌに対する差別がある」と言う人がいれば、 それはその人がアイヌである事以外の問題であると考えられるため、 それは民族問題ではなく、別次元として教育問題・労働問題として 考えるべきでしょう。 アイヌ語を日常的に流暢に話す事の出来るactive speaker は絶滅しました。 したがって、この日本には「アイヌ民族」は存在していないというのが私の 見解です。 アイヌ民族はウィルタ民族同様、既に絶滅した民族だと言えるでしょう。 「アイヌ民族」なる民族は存在しません。 ゆえに「アイヌ差別」もありません。 異論はありますか?

  • アイヌ民族と琉球人

    私は北海道に住んでいます。琉球人(沖縄県人)とアイヌ民族はそっくりだと思います。この日本列島で北と南でその中間はみんな同じですが、そのルーツを知りたいのです。

  • 朝鮮民族について

    大和民族は主に渡来系と原住民の混血によって形成された言いますが、歴史的経緯や地理的な要素を考えると、朝鮮民族についても蒙古系やツングース系や中国系(中国も混血が多いですが…)との混血が考えられるんですが、 ①朝鮮民族はどのような過程(混血の経緯)で形成されたか? ②朝鮮民族が最も強い影響を受けた民族はどの民族か? ③南北朝鮮国内における朝鮮民族の地域的多様性はどのようか?(日本を例にすると、近畿地方に渡来系要素が強く、沖縄に原住民系要素が強い、という感じで) の3点について、存じている人がいたら教えて下さい!!

  • 沖縄と琉球民族について。

    現在、日本(沖縄)に住む琉球民族の人口を教えてください。 「沖縄に住む人」=「琉球人」なのでしょうか? それともこれらの定義は全く別のものですか? 例えば北海道に住む人が全員アイヌ人ではありませんよね? それと同じように、沖縄に生まれ育ったからといって、琉球人とは限らないのか、それとも沖縄の人(沖縄出身の人)はみんな琉球人なのでしょうか? また、沖縄の人=琉球人でない場合、現在琉球人は沖縄人口の何割を占めるのか教えてください。

  • 『日本人のルーツ』科学の表現と解釈の正確さ。

    (宝来聡著『DNA人類進化学』岩波書店の7ページ目より>『引用』) >『、いま、ミトコンドリアDNAの塩基配列をヒトとチンパンジーで比較すると、約九%ほど異なっていることが知られている。ところが、ミトコンドリアではなく核のDNAにおいて、二種間の同じ遺伝子配列を調べると、わずか一%しか相違がない。共通の祖先から分岐した後の時間はミトコンドリアも核も同じであるから、その間に蓄積された塩基置換数はミトコンドリアDNAのほうが核DNAより九倍多いことになる。』(引用終わり) 「塩基置換数が9倍多いこと」になるのですか? また、宝来聡(京大動物学科卒。医学博士)の研究成果の話題から始まる以下のHP(作者は日の丸を否定しているグループ)によると、(『日本人のルーツを探れ』(NHK出版)も参考にしていると思われますが) >『ここ百年あまりで刷り込まれた「単一民族神話」と決別し』 (http://www.ne.jp/asahi/manazasi/ichi/syakai/ikutumono0102.htm) とあるのですが、宝来氏の方は「単一民族でない」などと言っていませんよね。それこそ、その決別が、ここ50年あまりの人らが刷り込みたがっている『神話』であり、現実の科学・国語との決別にすぎませんよね。 「日本人は単一民族である」は神話なのですか?「日本人は他民族である」が科学なのでしょうか?

  • 琉球民族を先住民族と認めないのは

    琉球民族を先住民族であると日本政府が認めないのは中国を意識しての事ですか?