• ベストアンサー

長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か

長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か。二本鎖の場合は何通りか。 この質問に、5塩基と4塩基のヌクレオチドを考えてみました。 5塩基だと、GGCTAとTAGCCは GGCAT CCGTA TAGCC ATCGG と、二通り出てきて、同一でありました。 したがって、1/2*4^Nと考えてみました。 (1/2は二組が二つとも同じなので、ひとつに考えるために決定。4~Nは4塩基(A,T,C,G)で並べると、4のN乗必要である、と考えました) 次に、4塩基の場合を考えて見ますと、 Aから始まる4つの塩基(ATGGなど)と残りのT,C,Gから始まる4つの塩基を同様にならべてみました。 すると、合計4の4乗つまり256通りの塩基配列ができました。 ここで、5つの塩基の時と同様、 ATCCとGGATは、同一の塩基 すなわち ATCC TAGG GGAT CCTA と出てくるので、1/2*4^Nと考えてみました。 すると、答えから、 ACGTのときは ACGT TGCA という組み合わせが考えられ 同様にTGCAのときは TGCA ACGT という組み合わせが考えられ、 最初の ACGT TGCA は180度回転させると一つの塩基配列の中で、まったく上下同様の塩基配列が現れることになりました。 つまり → ACGT TGCA ← というものは、180度回転させると、全く同じものなのです。 そこで疑問です。 この問題の回答に 奇数の塩基の数のときは 1/2*4^N 偶数の塩基の数の時には 1/2*4~N+1/2*4^(1/2)N と出てきたのですが、 1/2*4~N+1/2*4~(1/2)N の +1/2*4~(1/2)N のところが分かりません。 たぶん、 ACGT TGCA や CTAG GATC のようなものに関係する数式だと思います。 でも、理解できません。 教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • Chicago243
  • ベストアンサー率38% (401/1043)
回答No.5

1) ATTT TAAA 2) TAAA ATTT 3) AAAT TTTA 4) TTTA AAAT 1)と3)は同一で配列Aとしましょう 2)と4)は同一で配列Bとしましょう ところがAとBは違う配列です。 なぜならDNA(RNAも)は配列に極性(のようなもの)があります。 5'ATTT3' 3'TAAA5' と書けばわかり易いと思います。ふつうDNAの配列を表記する時は、糖鎖の5'が露出している方から(左から右に)並べていきます。反対側がの3'が露出していることになります。しかし、それにくっつくしたの配列はDNA(RNAも)の性質上左が3'となります。 5'ATTT3' +鎖 3'TAAA5' -鎖 で、3'TAAA5' -鎖を上にして表記すると 5'AAAT3'になるわけです。これが1)と3)が一緒になる理由です。 でこれが2で割る理由です。奇数の場合は単純に2で割ればことがすむのですが、偶数の場合(完全な)パリンドロームが問題になります。これは2で割る必要がないので私の計算で先にこの数を求めて引いておいたわけです。 (完全な)パリンドロームは全長2nの時前半の半分n個の配列が決まるとおのずと後半が決まります。 例えば2n=8のばあい前半がATGGだと後半はCCATにならざる終えないわけです。 したがって(完全な)パリンドロームのかず4^nを求めて4^2nから引いたわけです。 たぶんこれでご質問の答えをフォローしていると思いますが、疑問があればおっしゃってください。返事は遅くなるかもしれませんが、いたします。

jack1975
質問者

お礼

質問の回答をありがとうございました。 一応質問の内容を締め切らせていただきます。 ありがとうございました。

jack1975
質問者

補足

分かりました。 5'ATTT3' と、定義すると、 5'ATTT3' と 5'TTTA3' は、違うという意味ですね。 つまり、ATTTもTTTAも、紙に書いてみて、紙を折り曲げたからATTTもTTTAも同一という立体的な違いは、ないという意味ですね。 遺伝子が5’から3’に移動する『決まり』を私は見逃していたのかもしれません。 → 5'○△×□3' なら、 5'□×△○3' → は、異質というわけですね。 それで、回転対称の分は、数えて、重なることなく、すべて異なったものとして、数えることが出来ることがわかりました。 つまり、問題文では、 AGCT ACGT TGCA TCGA CATG CTAG GATC CTAG は、 5'AGCT3' 3'TCGA5' 5'ACGT3' 3'TGCA5' 5'TGCA3' 3'ACGT5' 5'TCGA3' 3'AGCT5' 5'CATG3' 3'GTAC5' 5'CTAG3' 3'GATC5' 5'GATC3' 3'CTAG5' 5'GTAC3' 3'CATG5' となり、別々のものとして8個取り出せるわけですね。 もし、極性がなければ、また、別の数式がでてくるということですね。 ありがとうございました。 こう、極性のところまで確実に数式で出てくるというのが、不思議でたまりません。 うまくなっているものですね。どういう性質を選び出して、こう、数式に当てはめるのでしょうか。まだまだ私も未熟者です。本当にありがとうございました。 また、考えてみます。

その他の回答 (4)

  • Chicago243
  • ベストアンサー率38% (401/1043)
回答No.4

付け加えておきます。 私が回転対称と申し上げたのは、属に言うかいもん構造(パリンドローム)のことです。 http://contest.genome.ad.jp/2004/problem3.html

jack1975
質問者

お礼

丁寧な質問の答えを教えていただき、ありがとうございました。

jack1975
質問者

補足

tRNAに見られるかいもん構造のことですね。どこかで読みました。 かいもん構造が、N個のヌクレオチドの数のうち、どれくらいをしめるかという問題で、難しい質問をしてしまいました。 この計算式も難しそうですね。 要するに、奇数個のヌクレオチドではありえない構造が、偶数ではありえるということですね。 そうして、かいもん構造は、ダブるという構造から、違う次元の考えをしなければならない、特徴的な回転対称をしているということですね。 ↑この考え方が、実際的には、現在の私の実力では考えにくいと思いましたが、Chicago243さんの考え方で、少し、明るくなったような気がします。 パソコンで画面に映し出して、「ここが、こうなって、回転構造だと、ダブるヌクレオチドから、数を考え直さなければならない。」とか、具体的な例を示すことが出来たらいいですね。 本当にありがとうございました。一応、友達にもいってみて、回答を考え直したいと思います。

  • ga111
  • ベストアンサー率26% (247/916)
回答No.3

最初にご指摘のように奇数でも回転対象構造はできますね。すべての私の意見を取り下げます。取り急ぎお詫び申しあげます。

jack1975
質問者

お礼

いえいえ、同じ質問を一緒に考えてくださって、ありがとうございます(^^

  • Chicago243
  • ベストアンサー率38% (401/1043)
回答No.2

偶数の時回転対称が問題になるということですね。こう考えればいいのではないでしょうか? 全長2nの時例えば5'から半分nこが決まれば回転対称の配列がおのずときまりますよね。 すなわち4のn乗この回転対称のパターンがあるわけです。この回転対称を除いた配列では ATCC TAGG GGAT CCTA で示されているようにだぶるわけですね。 ですから、まず4の2n乗から回転対称の数だけ引いて置きましょう。 4^2n-4^n この引いたのこりが、2倍にだぶっているわけですから、 (4^2n-4^n)/2 回転対称の数を補うと (4^2n-4^n)/2+4^n (初めに述べたように2nが全長です)

jack1975
質問者

お礼

本当に分かりやすい説明を有難うございました。

jack1975
質問者

補足

Chicago243さん、ありがとうございます。 さて、質問なのですが、たとえば、 ATTT TAAA は、 TAAA ATTT と、同一と考えますよね…。 AAAT TTTA は、どうなるのでしょうか? TTTA AAAT と、同一に考えるのでしょうか? もし、Chicago243さんのように考えるなら、 ATTT TAAA は、 AAAT TTTA と、同一と考え、 TAAA ATTT は、 TTTA AAAT と、別に考えるのですか? いちおう、半分に計算してしまうのですが、 AGCT TCGA は、(ダブっている数を考え) TCGA AGCT と、同一と考え、やはり、半分に計算します。 しかし、 AGCTは、回転対称というのがあるんですね。 そうしたら、その数え方は、 AGCT              AGCT (二倍にダブっているペア)>  (回転対称) TCGA              TCGA ということで、二倍にダブっているペアと回転対称のペアと別に考えるのですね。 ここでは、 AGCT は、”二倍にダブっているペア”と、”自分自身回転対称して、同じと考える『自家(自分自身の)ペア』”と考えるから、 回転対称は、 ある長さのヌクレオチドの数^a/2(a任意ここでは、Chicago243さんの言うように、2n、か、質問文のようにn)と考えると、いいということですね。 回転対称は2n個のヌクレオチドの半分が決まれば、残りのヌクレオチドは、4^n/2*1*1*1…(1の数は偶数個)という風に決まるのですね。 合っているでしょうか? よって、残りは、Chicago243さんのいうとおり、考えたらいいというわけですね。 一つ疑問だったのは、 ACGT は、自分で ACGT TGCA と並べると、回転したら同一だったということと、 ACGT TGCA は、 TGCA ACGT と、同一ではないかということ、つまり、紙に書いた ACGT TGCA と TGCA ACGT は、この二つの間の線で、下から上へと折りたたむと同じであるのじゃないだろうかという疑問です。 すると、回転対称の数も変わってきますよね…。 こういうことは考えないで、二次元で考えるのかなとふと考えました。(二次元なら、回転で理屈がつくからだと思うのです。三次元なら折りたたむと同一) ダブるという考えが、分かってないのかもしれません。 こういうのは、二次元の紙の上で考え、折りたたんだら同一とかそういう風には考えないのでしょうか?(そういう気もしますが…(^^;) 一応、ACGTに始まり、4^4つまり256個紙に書いて確かめてみました。 すると、回転対象は8個あり、計算式の当てはめ方は、ちょっと考えていますが、回答は得られました。 こういう計算は、事象から推定して、考えるというのは難しいので、Chicago243さんのように考えて見ますが、鵜呑みにすると、Chicago243さんの計算がもったいなく思えるので、疑問点をあげてみました。 回答を考えてくださって、ありがとうございます。 もう少し、回転対称という言葉を説明してください。 そうしたら、理解できるような気がします。 今日は本当にありがとうございました。伯父が急病したため、急遽出向いたため、返答が遅れてしまい、ご心配をお掛けしました。 丁寧な回答文、ありがとうございます。     

  • ga111
  • ベストアンサー率26% (247/916)
回答No.1

むっずかし。 答え本当にあってますか? 回転対称構造ができるのは偶数のときのみですよね。そうすると、回転対称構造によって組み合わせの数がすくなくなるのは偶数のときじゃないでしょうか? すなわち AAGTT TTCAA は回転させても違う並びです。 よって偶数のとき (1/2)*4^n よって奇数のとき 4^n のような気がするんですが、、、自信はまったくありません。

jack1975
質問者

お礼

一緒に質問を考えてくださり、有難うございました。

jack1975
質問者

補足

ga111さん、ありがとうございます。 答えは記述のようになっているので、たぶん合っていると思うのです。 むずかしいですよね・・・(^^;)

関連するQ&A

  • ランダム配列をもつDNAの作製方法

    タイトルの通り、ランダムシークエンスをもつDNAを作るには複数の塩基を加えて加えることにより合成できますが、この時一定の長さ(塩基数)をもつようにするにはどのようにすればよいのでしょうか?たとえば、20塩基オリゴヌクレオチド鎖を合成する場合などです。

  • 塩基配列とアミノ酸配列について

    大腸菌から単離したDNA断片の片方の鎖の構図は下のようであった。 5'-GTAGCCTACCCATAGG-3' このDNA鎖の相補鎖を鋳型として転写したmRNAの塩基配列を書きなさい。5'および3'の方向性も必ず記入しなさい。 ↑この答えはTをUに変えて、 5'-GUAGCCUACCCAUAGG-3'で正しいですか? また、上記で転写されたmRNAの5'末端から翻訳が開始するとすれば、生じるペプチドのアミノ酸配列を書きなさい。N末端およびC末端を記入すること。 ↑この答は、 N-バリン、アラニン、チロシン、プロリン、チロシン-C らしいのですが、どうやって解くかわかりません。どなたか教えてください。

  • DNA断片のシークエンス結果の読み方について

    今回、実験で菌体のDNA断片の塩基配列を解析しました。 その結果、A・T・G・C の組み合わせ配列の最後に、 NNNNNNNNNNNNNNNNNNNNNNNNNNNNと、Nが多数ありました。 Blastで解析し、菌の同定は出来たのですが このNNNNNというのがきになりました。 このNNNNNNNNNが意味していることは何か、ご存じの方がいたら教えてください。 ヨロシクお願いします。

  • DNAの塩基配列はどうやって調べるのでしょうか?

    化学、分子生物学ド素人です。遺伝情報である塩基配列(A, G, C, T)ですが、どうやって調べているのでしょうか?同様の質問は存在しましたが、既に私には高度過ぎます。電子顕微鏡で調べてる訳ではないという所あたりから教えて頂ければ幸いです。

  • 配列

    適当な記述ですが、次を見てください。 void roll(int *c) { int n, b2[8]; if(t<3) { for(n=0; n<8; n++) b2[n]=c[n]; for(n=0; n<8; n++) c[b2[n]]=7-n; for(n=0; n<8; n++) printf("%d",c[n]); printf("\n"); t++; roll(c); } else t=0; } int main() { int b[]={3,6,4,0,7,2,5,1}; roll(b); for(n=0; n<8; n++) printf("%d",b[n]); //36407251が表示されるようにしたい。 return(0); } rollが何の関数かは省略しますが、rollにmainのb(ポインタ?)を渡し、ある処理をして,それでmainに戻ってきた時にb[]を表示すると、36407251が表示されません。 ポインタを引数にするってことはポインタでさしてるとこをrollで操作してるわけですよね? そうすれば変わって当然だとはおもいます。 でも関数1で関数2に配列1を渡し、その関数2の中でで配列1の値が変化しても、元の関数1にもどれば配列1のまま変化していないようにするにはどうすればいいですか? やはり もう1つ配列を用意しなきゃだめなのでしょうか。

  • このDNAの問題の答えはこれで合っていますか?

    この問題の答えはこれで合っていますか? 間違っていたら訂正をお願いします。 あるDNA鎖の塩基配列を調べた。その結果、本DNAは、核酸塩基としてグアニンを6.0×10の4乗個を含み、GC含量は75%であった。本DNA鎖のシトシン塩基の数と全塩基対の数(bp) を答えなさい。 グアニンとシトシンの数は相補的で等しいからシトシンは 【6.0×10の4乗個】 グアニンとシトシンの数を合わせると「12.0×10の4乗個」 それが全塩基対の75%だから 全塩基対は「16.0×10の4乗個」指数の数値を整えて答えは 【1.6×10の5乗個】

  • 生物の基本的な質問です。

    生物の基本的な質問です。 コドンと塩基配列の違いって何でしょうか? コドンはヌクレオチドが3つ連なっているけど、DNAの塩基配列はGGUTCT・・・って感じに相補的なヌクレオチドがくっつくと聞きました・・・ もう訳が分かりません。ちなみにヌクレオチドは相補的なモノとくっつくってありましたが、 CにはT、とか結合するヌクレオチドって決まっているのですか?? 本当に、いたしかたなく勉強しています。 どうか、救いの手を・・・宜しくお願いします。

  • DNAプローブの長さとは?

    ヒトゲノム中(30億bp)でランダム配列と仮定した場合、ある特定の配列(長さn塩基)が2度出現する確率が100分の1以下になるには n≧□塩基 このようなほぼ確率の問題なのですが、nが何塩基以上でこの確率の条件を満たすのか求める問題です。 式などを含めた求め方が、わかる方がいましたら教えてください。 (ちなみに答えは16or17塩基程度になるそうです)

  • DNAシークエンスの失敗

    最近DNAシークエンスを行っていると、毎回ほぼすべての検体において同じような結果がでて失敗しています。 本来一つだけ出るべきピークが、二つ一塩基分ずれて並んででていて、それがすべての塩基で起こっているのでそれぞれ隣のピークが重なって、結果がNとなっていしまいます。 (たとえば「G・A・T」とある場合「G・GとAが重なったもの・AとTが重なったもの・T」のようにでます) それぞれのピークが一つにまとまれば本来出るべき塩基配列と一致するので、なにかはっきりとした原因があるような気はするのですが思いつきません。 シークエンス初心者なもので勉強不足で申し訳ないのですが教えていただけませんか?

  • 塩基配列表の読み方

    塩基配列表について質問があります。 先日、生物学の授業にて、 塩基配列表(genetyxを用いてプリントアウトされたsequence file)が書かれたプリントを授業で配られ、「プライマーを設定してみよう」と言われたのですが、プリントの塩基配列に関して読み方が分かりません。 プリントには塩基番号1から1000まで、a,g,c,tからなる塩基配列が記載されています。 この場合、どちら(塩基番号の1側か1000側か)が3'末端になるのでしょうか? また、通常このように記載されるのは元のDNA鎖の配列なのでしょうか?それとも、cDNAなのでしょうか? DNAであればセンス鎖、アンチセンス鎖があると思うのですが、どちらなのでしょうか? 因みに、プリントには塩基番号1からttagacccgataagcccgcataatgc・・・・・と書かれています。