• 締切済み

アミノ酸配列からの逆翻訳プログラム

ある特定の種のコドンバイアスに対応して、アミノ酸配列から塩基配列に逆翻訳してくれるプログラムを探しています。 (例えばセリンをコードするコドンの使用比が、TCC:TCG:AGC=3:3:1になるように・・・等) ご存知でしたらお教えください。

みんなの回答

回答No.3

コドンの最適化とか codon optimization でググるとたくさん見つかります。 OPTIMIZER http://genomes.urv.es/OPTIMIZER/ 例えば上記のものは codon usage database からデータを持ってくればそれに合わせて逆翻訳してくれるので、ご質問の目的に適うと思います。

  • ki073
  • ベストアンサー率77% (491/634)
回答No.2

別の目的で作りかけていたものですが、10分ほどかけて改造しました。 書きかけであったのでチェックほとんどできていませんので、コドンの記述は確認の上で 他の回答が無くて、どうしようもない時はお使いください(押し売りみたい) 核酸配列の後の数値が出現確率です。とりあえず全部1にしてありますので、適当に変えてください。小数を含んでいても正常に動きます。 適当なファイル名(例えば henkan.rbなど)で保存し、ターミナルソフトで ruby henkan.rb とすれば動くはずです。乱数で配列を決めていますが、ソフト内蔵の乱数ですのでそこそこのレベルということで、 気になるようでしたら、他の乱数に変えてください。 ------------------------------------ aa_to_codon={"A"=>[["gca", 1], ["gct", 1], ["gcg", 1], ["gcc", 1]], "C"=>[["tgt", 1], ["tgc", 1]], "D"=>[["gat", 1], ["gac", 1]], "E"=>[["gaa", 1], ["gag", 1]], "F"=>[["ttt", 1], ["ttc", 1]], "G"=>[["gga", 1], ["ggt", 1], ["ggg", 1], ["ggc", 1]], "H"=>[["cat", 1], ["cac", 1]], "I"=>[["ata", 1], ["att", 1], ["atc", 1]], "K"=>[["aaa", 1], ["aag", 1]], "L"=>[["tta", 1], ["ttg", 1], ["cta", 1], ["ctt", 1], ["ctg", 1], ["ctc", 1]], "M"=>[["atg", 1]], "N"=>[["aat", 1], ["aac", 1]], "P"=>[["cca", 1], ["cct", 1], ["ccg", 1], ["ccc", 1]], "Q"=>[["caa", 1], ["cag", 1]], "R"=>[["aga", 1], ["agg", 1], ["cga", 1], ["cgt", 1], ["cgg", 1], ["cgc", 1]], "S"=>[["agt", 1], ["agc", 1], ["tca", 1], ["tct", 1], ["tcg", 1], ["tcc", 1]], "T"=>[["aca", 1], ["act", 1], ["acg", 1], ["acc", 1]], "V"=>[["gta", 1], ["gtt", 1], ["gtg", 1], ["gtc", 1]], "W"=>[["tgg", 1]], "Y"=>[["tat", 1], ["tac", 1]]} aa_to_codon.keys.each do |c| sum=0.0 aa_to_codon[c].each{|a| a[1]=(sum=sum+a[1])} end aa_seq="VKHSLCCC" # アミノ酸配列 na_seq=aa_seq.scan(/./).collect{|aa| cods=aa_to_codon[aa] rnd=rand()*(cods[-1][1]) # 乱数 cods.drop_while{|c| c[1] < rnd}[0][0] }.join(" ") puts na_seq.upcase # 小文字でよければ.upcaseを削除

  • ki073
  • ベストアンサー率77% (491/634)
回答No.1

コドンバイアスには対応していませんが、Rubyというプログラム言語で書かれた逆翻訳の自作ソフトがあります。 実質10行程度の短いものです。 Rubyが使えるパソコンがあるのでしたら、夕方にでもコドンバイアスに対応した改造をしてここに掲示しますが。 Macのここ数年以内のものなら最初から入っていますし、Linuxも入れるのは簡単です。 Windowsへの入れ方は調べてください。

関連するQ&A

  • DNA塩基配列から推定されるアミノ酸配列を答えよという問題なのですが分かりません。

    ある遺伝子のコード領域内の部分DNA塩基配列を示す。この配列から推定されるアミノ酸配列をすべて答えよ、という問題です。 与えられた配列は以下の通りです。 (配列)5’---ATTGCATTACACAT---3' 下にコドン表が示されてます。 私の考えでは 5’---ATTGCATTACACAT---3' は非鋳型鎖だと思うので鋳型鎖にして 3’---TAACGTAATGTGTA---5' これを転写させる 5’---AUUGCAUUACACAU---3' そして3つで一つのアミノ酸を指定するというので切り方は3通りあると考えました。 AUU/GCA/UUA/CAC/AU --(1) AU/UGC/AUU/ACA/CAU --(2) A/UUG/CAU/UAC/ACA/U --(3) それぞれコドン表に合わせて (1)では Ile/Ala/Leu/His (2)では Cys/Ile/Thr/His (3)では Leu/His/Tyr/Thr というようにしたのですが合ってるんでしょうか?ほぼ独学なので見逃してる点もしくは間違っている点などご指摘ください。 また、この塩基配列にはなかったのですが 開始コドン(AUG)や終止コドン(UAA,UAG,UGA)が配列にあったなら答えはどうなるんでしょうか? たとえばAUAUGCAUUGACACAUとします。 AU/AUG/CAU/UGA/CAC/AU この切り方だと翻訳はAUGからUGAでとまるのでUGA以下のCACは無視するのでしょうか? つまり、この場合はアミノ酸配列はMet/Hisだけってことですか?

  • 遺伝子の塩基配列の問題がわからないです。

    ある遺伝子の塩基配列を調べたら以下のようであった 3'-AGGGCCGTTACCCGGTTCTCCTA-5' (1)このDNAを鋳型としたときに転写されるmRNAの塩基配列を書け (2)(1)のmRNAから翻訳されるポリペプチドアミノ酸のアミノ酸のトリプレッドコドンを書きなさい という問題なのですが (1)は 3'-UCCCGGCAAUGGGCCAAGAGGAU-5'  になると思うのですがこれだと5'側から見て翻訳開始コドンAUGがないので(2)の問いに答えられないですがこのこの考え方は間違ってるのでしょうか? いろいろ調べたのですがこれといったものがなくて困っています。 どなたか教えてくださいよろしくお願いします。

  • DNAのコードについて教えてください

    たんぱく質のアミノ酸残基TyrはmRNAの塩基配列の5’UAC3’でコードされている。 (1)このコドンの鋳型となるDNAの塩基配列 (2)このコドンに結合するtRNA(Tyr)のアンチコドンの塩基配列 たんぱく質のアミノ酸残基HisはmRNAの塩基配列5’CAU3’でコードされている。 (1)このコドンの鋳型となるDNAの塩基配列 (2)このコドンに結合するtRNA(His)のアンチコドンの塩基配列

  • コドンとアンチコドン

    翻訳についての疑問なんですがご存知の方教えてください コドンを認識する際、アミノアシルtRNAのうち そのコドンに対応するアンチコドンをもつものが結合するようですが 数十種のtRNAの中から適合するのを探し出していたのでは 反応としてはとても遅いのではないかと思うのですが実際のところどうなんでしょう? もし、開始配列のあとは全て同じアミノ酸をコードする配列があり メチオニンと、配列と同じアミノ酸だけを入れると 通常の翻訳とは反応スピードが全然違うなんてことが起きるのでしょうか? またコドンはどうやって3つって証明されたのでしょう?

  • アミノ酸配列と遺伝子について

    レポートをやっていて、分からなくなってしまいましたので、 どなたか教えてください!!お願いします! 問題:異なるアミノ酸から構成されるデカペプチドを想定し、その遺伝子について複製、転写、翻訳についてプロセスの概要を述べよ。 1.想定したデカペプチドのアミノ酸配列および遺伝子 2.複製について 3.転写について 4,翻訳について 1番がよくわかりません。 一応、 N末端 Val-Ser-Asp-Leu-Tyr-Arg-… C末端 と想定し、コドン表を用いて 5’ GCG-UCA-GAC-UUA-UAC-CGG-… 3’ としてみましたが、 これはmRNAですよね? だとすると、2番の複製ができないのではないかと思いました。 分かりにくい質問ですいませんが、 よろしくお願いします。

  • 翻訳に関する問題です!

    以下に記すものは48個のヌクレオチドからなるmRNAの塩基配列であり、翻訳される場合には左端の開始コドンAUGから翻訳が開始される。 AUG AAG CGC UGC GUA ACC UCU AGG ACA CCA UGU CAA AUA UGA CUU UAA 【問】 突然変異が起こり、22番目の塩基がAからCに置き換わった場合、この塩基を含むコドンが指定するアミノ酸は何か。 A.アルギニン 【問】 5番目のヌクレオチドが失われ、一塩基分が短くなり47個のヌクレオチドからなるmRNAになった場合、翻訳されるたんぱく質に含まれるアミノ酸の数はいくつか。 A.4 文型から理系大学への受験で、先生も忙しいといってみて下さらず独学しております。 来月頭には試験本番です。 基本的な問題でつまずきお恥ずかしくはありますが、どうか解説お願いいたします!

  • 塩基配列・アミノ酸配列を同時表示できるツール?

    プライマー設計する時などに、 塩基配列とアミノ酸配列を上下に並行してアラインメントした資料があると便利なのですが(参考画像、文章末に説明有)、 塩基配列を入力するだけで自動でそのようなファイルを作製できるツール(PCソフト・ウェブツールなど)などありませんでしょうか? また、 ・一定の塩基数間隔で改行 ・一部の配列をラベル(アンダーライン・フォント・注釈など) ・ファイルエクスポート ・プリントアウト などの機能付きだと、なお助かります。 現状、そのような資料を手打ちですべて作製しています。 ご存じの方おられましたら、 ご教示いただくことできないでしょうか? よろしくお願いいたします。 (添付した参考画像) 目的遺伝子(仮)のDNA配列の下に、 コドンに対応するアミノ酸の一文字表記を テキストファイルに打ち込んだもの。 ・100塩基毎に改行 ・イントロン →グレー、エキソン →ブラック ・プライマー →アンダーライン+イタリック など手を加えています。

  • アミノ酸の変異について

    アミノ酸の変異について 大学の授業で、どのようにしたら特定の場所にアミノ酸の変異を起こすことができるのか 考えるということをやりました。 先生が出したヒントは、 プライマーは20~30塩基ぐらい配列をもつことができるということと 6~7割/20~30塩基の配列が相補的ならばDNAはくっつく という2つを出してくれました。 先生は、このヒントをふまえて考えてほしいとのことです。 わかる方がいらしたら教えてください。 お願いします。

  • どなたか教えてください。

    生物学の練習問題なのですが… DNA は二重らせん構造をしており,相補的組み合せの核酸塩基同士が水素結合でつながっている.例えば一方のヌクレオチド鎖のTGT という塩基配列は,他方のヌクレオチド鎖の【カ】という配列と結合している.転写では,DNA の【カ】という配列を鋳型にすると,【キ】という配列を持つmRNA が作られる.翻訳では,mRNA の【キ】という配列に【ク】という配列を持つtRNA が結合する.このtRNA はアミノ酸の1 種である【ケ】を運んでくる.こうして運ばれたアミノ酸は隣のアミノ酸とペプチド結合でつなげられて【コ】が作られていく. 私は、【カ】ACA 【キ】TGT 【ク】コドンACA 【ケ】アンチコドンUCU 【コ】グルタミン酸 だと思うのですが自信がありません。 どなたかお答えお願いします。

  • アミノ酸が20種類である理由

    蛋白質を構成するアミノ酸は何故20種類なのでしょうか? 塩基配列で指定できる数よりもぐっと少なく、 しかし塩基の種類に比べるととても多い。 塩基性・酸性、親水性・疎水性、という大まかな性質で分けても、 同じグループに複数種のアミノ酸が入ります。 それでも生体内で使われるアミノ酸は20種類。 それ以上でも以下でもないのには、何か理由があるのでしょうか?