• ベストアンサー

DNAプローブの長さとは?

ヒトゲノム中(30億bp)でランダム配列と仮定した場合、ある特定の配列(長さn塩基)が2度出現する確率が100分の1以下になるには n≧□塩基 このようなほぼ確率の問題なのですが、nが何塩基以上でこの確率の条件を満たすのか求める問題です。 式などを含めた求め方が、わかる方がいましたら教えてください。 (ちなみに答えは16or17塩基程度になるそうです)

質問者が選んだベストアンサー

  • ベストアンサー
  • Sbacteria
  • ベストアンサー率42% (55/129)
回答No.2

”ある特定の配列”がポイントですが、適当に選んだ任意の配列という意味で考えてみましょう。    確率=4^(-n)=pとして, 試行回数=3.0x10^9=N (厳密には、1塩基づつずらしていくと、n-1だけ短くなりますが、nは高々2桁程度の数値なので無視しましょう)とします。  この条件で、ある特定の配列が、Nの試行で2回(丁度2回ですよ)出てくる確率Pは、   P=NC2*p^2*(1-p)^(N-2) になります。 ただし、NC2はNこから2個とる組合せの数(NC2=N(N-1)/2)です。 つまり、N本のくじから、2本があたりで、残りN-2本がはずれである確率を求めるわけです。 これで、計算してごらんなさい。

kumafugu
質問者

補足

回答ありがとうございます。 このように計算するとn=17~18くらいで1/100以下になります。 やはりこのような場合は、帰納的に順番にnを代入して計算していくのが妥当なのでしょうか?

その他の回答 (1)

  • MIYD
  • ベストアンサー率44% (405/905)
回答No.1

確率をどのように計算するのかによるのだと思いますが、 計算方法についての指示は無いのでしょうか。 プライマーの設計などでは、単純に4^nで計算して、 N=16で4.3*10^9 N=17で1.7*10^10 ゲノムDNAが3*10^9なのでゲノムを1~4回カバーできる位なので1/100の確立にはなりません。 この計算法だと N=19の時に2.7*10^11でゲノムサイズの92倍にあたります。

kumafugu
質問者

補足

回答ありがとうございます。 一応、1ヶ所にATGCの4塩基のどれかが入ると考え、ヒトゲノム中に長さn塩基の配列が1度は必ず出るので確率を1とし、2度目に同じ配列が現れる確率を1/100として考えて (1/4^n)*{3*10^9-(n-1)}≦101/100 このように式を立てる方法もあるらしいのですが、なぜこうなるかがよくわかりません(本当に正しいかわかりません)。この他に具体的に値がn≧16.・・・と求めれるような、もっと簡単な求め方がなどがありましたら教えてください。

関連するQ&A

  • 特定の配列がいくつ現れるか(期待値の計算)

    DNAの話なのですが、4つの異なる文字が3×10^9個の1次元配列にランダムに納まっているとします。どの文字も同様に確からしく出現するとして、ある特定の10文字の配列と同じ10文字の配列が、この3×10^9個の配列の中に何ヶ所出現するかを求めたいのです。 1ヶ所も現れない確率、1ヶ所だけ現れる確率、2ヶ所現れる確率…、と求めて行き、最後に期待値を出そうと考えています。確率の漸化式を立てて一般項P(n)を求めてからn=0~3×10^9までΣnP(n)を計算するという方針ですが、式が立てられず悩んでいます。 数字が大きいので端のことなどはあまり気にしなくても良いのですが、ものすごく複雑になりそうに思います。それとも簡単な方法があるのでしょうか。

  • 長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か

    長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か。二本鎖の場合は何通りか。 この質問に、5塩基と4塩基のヌクレオチドを考えてみました。 5塩基だと、GGCTAとTAGCCは GGCAT CCGTA TAGCC ATCGG と、二通り出てきて、同一でありました。 したがって、1/2*4^Nと考えてみました。 (1/2は二組が二つとも同じなので、ひとつに考えるために決定。4~Nは4塩基(A,T,C,G)で並べると、4のN乗必要である、と考えました) 次に、4塩基の場合を考えて見ますと、 Aから始まる4つの塩基(ATGGなど)と残りのT,C,Gから始まる4つの塩基を同様にならべてみました。 すると、合計4の4乗つまり256通りの塩基配列ができました。 ここで、5つの塩基の時と同様、 ATCCとGGATは、同一の塩基 すなわち ATCC TAGG GGAT CCTA と出てくるので、1/2*4^Nと考えてみました。 すると、答えから、 ACGTのときは ACGT TGCA という組み合わせが考えられ 同様にTGCAのときは TGCA ACGT という組み合わせが考えられ、 最初の ACGT TGCA は180度回転させると一つの塩基配列の中で、まったく上下同様の塩基配列が現れることになりました。 つまり → ACGT TGCA ← というものは、180度回転させると、全く同じものなのです。 そこで疑問です。 この問題の回答に 奇数の塩基の数のときは 1/2*4^N 偶数の塩基の数の時には 1/2*4~N+1/2*4^(1/2)N と出てきたのですが、 1/2*4~N+1/2*4~(1/2)N の +1/2*4~(1/2)N のところが分かりません。 たぶん、 ACGT TGCA や CTAG GATC のようなものに関係する数式だと思います。 でも、理解できません。 教えてください。

  • プライマーの配列問題

    今、考えている問題なんですが。 ヒトのゲノムはほぼ3*10^9bpである。10塩基からなるプライマーと相補的な配列が、この中にいくつ現れるか計算しなさい(2本鎖であることを考慮すること)。ただし、4種の塩基の存在確率は等しいものと仮定する。 全く解くための方針が見つかりません。どなたかアドバイス頂けないでしょうか。

  • ゲノムとプライマーの配列問題

    今、考えている問題なんですが。 ヒトのゲノムはほぼ3*10^9bpである。10塩基からなるプライマーと相補的な配列が、この中にいくつ現れるか計算しなさい(2本鎖であることを考慮すること)。ただし、4種の塩基の存在確率は等しいものと仮定する。 これは題意として、いくつ現れるかといのは、期待値を聞いているのでしょうか? また、そうだとしても、全く解くための方針が見つかりません。どなたかアドバイス頂けないでしょうか。

  • このDNAの問題の答えはこれで合っていますか?

    この問題の答えはこれで合っていますか? 間違っていたら訂正をお願いします。 あるDNA鎖の塩基配列を調べた。その結果、本DNAは、核酸塩基としてグアニンを6.0×10の4乗個を含み、GC含量は75%であった。本DNA鎖のシトシン塩基の数と全塩基対の数(bp) を答えなさい。 グアニンとシトシンの数は相補的で等しいからシトシンは 【6.0×10の4乗個】 グアニンとシトシンの数を合わせると「12.0×10の4乗個」 それが全塩基対の75%だから 全塩基対は「16.0×10の4乗個」指数の数値を整えて答えは 【1.6×10の5乗個】

  • 制限酵素について

    特定の6塩基配列は平均すると、何塩基ごとに出現するか? という問題が非常に分からないんでどなたか分かり次第回答お願いします。

  • DNAの長さの計算(大学受験)

    DNAの長さの計算(大学受験) 模試の問題なのですが、解答に式しか書いていないので、どうしてそうなるのかわかりません。よろしくお願いいたします。 問題文 大腸菌の染色体DNAには約4.0x10^6塩基対が含まれている。 1,DNAの塩基対間の距離が3.4x10^(-10)mであるとすると、大腸菌1個に含まれる染色体DNAの長さは何mmになるか。 2,大腸菌のタンパク質の平均分子量を4万, タンパク質中のアミノ酸の平均分子量を100とすると、大腸菌の染色体DNAには最大限何種類のタンパク質を合成できる遺伝子の容量があるか。 まず問題文の「DNAの塩基対間の距離」についですが、私は、DNAは二重らせん構造なので、塩基対間の距離とは、二本のDNAの一本ずつの塩基間の距離(横同士の距離)だと思ったのですが、あっていますか?でも、この問題はDNAの長さつまり、縦の距離を聞いているのだからこの考え方はおかしいのかと思って、問題のいう「DNAの塩基対間の距離」を一本のDNA鎖の隣同士の塩基間の距離と考えてみました。そして式は、(4.0x10^6) /(3.4x10^(-10)) としました。 また問2は、1つのタンパク質は400個のアミノ酸からなる。つまり400x3塩基。 「4.0x10^6塩基対」含まれるので、全体では、4.0x10^6塩基x2倍。 よって、(4.0x10^6)x2/400x3=6666としました。 が解答は、 1,塩基対bp。原核生物にはイントロンがない。 (3.4x10^(-10))<m/bp>x(4.0x10^6)<m/bp>=0.00136m 2,タンパク質1文市中の平均アミノ酸数は400個より、必要なbp数は400x3(bp)なので、(4.0x10^6)/(400x3)≒3333 となっていました。 1はまったく解答の意味がわかりません。2は私の考えた数の半分ですね。4.0x10^6というのは、“対“だから全体はその倍になるのでは?と思いましたが。 特に問1について、どうして解答のような式になるのか教えてください。Bpという言葉も初めて聞きました。よろしくお願いいたします。

  • 生物の問題です

    DNAを6塩基対の配列を認識して切断したとき、1/4^6=1/4096で認識配列が4096塩基対に1回の確率で出現するというのはわかるのですがなぜ、それがDNA断片の平均塩基対数になるのでしょうか?

  • 遺伝子のゲノムの計算

    ヒトの1倍体ゲノムは約3.0×10^9塩基対(bp)で構成され、25000遺伝子の存在が予想される。 遺伝子の平均長が3.0×10^4bpの時、ヒトゲノムにおける非遺伝子配列の全ゲノムに対する存在率は何%になりますか?また、上記ヒトゲノムにおけるアデニン含有が1.8×10^9個であった時、同ゲノムのグアニン・シトシン含有(GC%)は何%となりますか? すみませんが計算の途中の過程や解説もできるだけ詳しくお願いします。

  • 生物に関する質問です

    問 2000塩基対からなる2本鎖DNAが、EcoR1(GAATTCの塩基配列を認識する)で1カ所切断される確率を根拠とともに答えよ。 答え  EcoR1が存在する確率を考えればよいので、  2000×(1/4)の6乗  という問題に関して。  1カ所切断する確率を求めるならば、2000塩基対の中にGAATTCの配列が1カ所存在する確率を求める必要があるのではないかと思うのです。 答えの計算方法は「少なくとも1カ所存在する確率」になってしまうのではないでしょうか? 考え方を教えて下さい。よろしくお願いします。