• ベストアンサー

ゲノムシークエンスのcoverageとは

ゲノムシークエンスでよく5xとか 8x coverage という表記を目にするのですが、これは一体何を意味しているのでしょうか? どなたかご存じの方教えていただけると幸いです。あるいは説明のあるwebpageを教えていただいてもうれしいです。

  • eja10
  • お礼率85% (6/7)

質問者が選んだベストアンサー

  • ベストアンサー
  • Mr_Spock
  • ベストアンサー率75% (57/76)
回答No.1

ゲノムの総配列数に対して、読んだ配列数の総和が何倍かということです。 ゲノム配列の決定は、近年ではいわゆるショットガンシークエンス法が主流です。ランダムなゲノムDNA断片を片っ端から読んで、数百~千塩基程度のバラバラの塩基配列データからコンピュータで配列のオーバーラップを見つけてパズルのようにつなげていきます。 仮に1 Gb (1,000,000,000 bp)のゲノムを、個々のデータ長が平均1000 bpのショットガンシークエンスしたとしましょう。ランダムなゲノム断片を読んで、1,000,000データ集めれば読んだ塩基数の総和はゲノムサイズに相当する1 Gbになります。これが1x coverageです。しかしこれでは、ランダムに配列を読んでいるし、オーバーラップもあるので、何度も繰り返し読まれている部分もあれば、一回しか読まれていない部分、全く読まれていない部分もでてきます。ゲノム全体を隙なく読み尽くすには、coverageを数倍から十数倍以上にする必要があります。何倍のcoverageでゲノム配列の解析を行ったかというのは、ゲノム配列データの完全性、正確性を判断する目安になります。

eja10
質問者

お礼

丁寧な説明ありがとうございます。よくわかりました。

その他の回答 (1)

  • Dr_Hyper
  • ベストアンサー率41% (2482/6031)
回答No.2

理論上、何回その生物のゲノムを繰り返し読んだかの意味ですね。 coverageの回数が多いほど信用できる配列であるということになります。 もちろん読みづらいところや、繰り返し配列でちゃんとデーターがつながっていないところなど残されていると思いますが、coverageが記載してあれば信用性の目安になります。

eja10
質問者

お礼

信用性として理解すればいいのですね。回答ありがとうございました。

関連するQ&A

  • ゲノムDNAをテンプレートにしてシークエンス?

    ABIのBigDye terminator v3.1のプロトコールをみていたら、テンプレートDNAの定量のところに「バクテリアゲノミック DNA」というのがありました。 それ以上のことは詳しく載っていなかったのですが、これは、「ゲノムをテンプレートにしてダイレクトにDNA配列を決定する」ということができるという意味なのでしょうか? ご存知の方がいらっしゃいましたら教えて下さい。 よろしくお願いいたします。

  • $1000ゲノムについて

    30億ドルのゲノムプロジェクトが終了し、現在では2000万ドルで便利なゲノムシーケンスが手に入れられるようになったがこれはいまだにビックプロジェクトやお金のかかる研究での利用しかできないことを意味している。 という文章の後に、つぎの英文が続きます The $1000 genome has become shorthand for the promise of DNA-sequencing capability made so affordable that individuals might think the once-in -a-liftime expenditure to have a full persnal genome sequence read to a disk for doctors to reference is worthwhile. となっています。 1000ドルゲノムは個人で収入可能なように作られた有望なDNA配列の速記で、完全なヒトゲノムシーケンスを医者が参照するためのディスクで人生で一度の出費非常にやりがいがある。 とニュアンスはわかりますが正確な訳が分からず、might以降から不安定な訳になってしまいました。 御教授頂ければ幸いです。

  • ゲノムアイランド、説明に使われているグラフの意味が良く分かりません。

    ゲノムアイランドについて、ゲノムアイランドとは 他の菌から転移してきたDNA領域との説明を受けました。 そして、ノートにグラフを書いて転移領域を示されたのですが このグラフの意味が良く分かりません。 グラフを見ると、下方に顕著に突起した緑色の領域が 転移領域であり、この部分は外来遺伝子領域であることが 漠然と分かりそうなのですが、正確に見ていくと良く分かりません。 ・X軸は具体的に何を示しているのか?正の位置がアデニンとチミン、負の位置がグアニンとシトシンとありますが 各々の何を表しているのか?含有量?? ・Y軸は何を表しているのか?DNAの塩基配列を末端から 番号を振っていき、その番号を表しているのか? だとしたらYの最終値はDNAの塩基配列の数? ・そもそもこのグラフは何を示しているのか? X軸とY軸の定義(上2問)が明らかになれば、分かるとは思うのですが。。。 多分染色体のATCGの分布を示しているかもしれませんが、 X軸とY軸が正確に何を示しているのかわからないので グラフの意味が良く分かりません。 要は、X軸とY軸について教えていただければ その後は考えて見ることが出来ると思うのですが、、。 もしご存知の方がいましたらお願いします。

  • シーケンスソフトを探しています

    レコンポーザForWindowsというシーケンスソフトを使っていましたが現在このソフトは無いようです。 同じような数値入力シーケンスソフトをご存知の方教えていただきたい。

  • 素人でも分かるシーケンス教材

    コンベア関係の仕事で制御の為シーケンスを読む必要が出来たのですが、私はA接点・B接点も知らなかったようなド素人です。 勉強しようにもどの教材も敷居が高く、ある程度の知識がある事を前提に説明されている為、現在大変難航しています。 シーケンスプログラムの仕組み、命令語1つ1つの意味、実際のラダーからその 読み方・説明までを素人にも分かりやすく簡単に理解させてくれる教材はないものでしょうか? 有料・複数の教材の組み合わせでも構いませんので(一般で入手が難しい物はその入手方法もお願いします)、ご存知の方がいらっしゃいましたら是非教えてください。よろしくお願いします。

  • シロイヌナズナのゲノムプロジェクトが始まったのはいつ?

    シロイヌナズナのゲノムプロジェクトはいつ始まったのでしょうか。 ネットなどで調べて2000年に終了したのはわかったのですが、 始まった年がわかりませんでした。 どなたがご存知の方がいましたら教えてください。

  • マウスゲノムプロジェクト

    現在、実験計画を考えてます。そこで、質問です。 マウスゲノムプロジェクトってどのくらい進んでますか?また、いつぐらいに完成する予定なんでしょうか? それと、完成したら自由に使えるんでしょうか? ご存知の方がいたら教えてください。よろしくお願いします。

  • ゲノムプロジェクト(ヒトゲノム計画等)について

    こんにちは。 初歩的な質問ですが、ヒトゲノム計画などのゲノムプロジェクトによって解明された事には どんなことがありますか。 例えば (1)、「ヒトの場合、『TCAGACTA』という塩基配列であればこの固体は白髪だ」だとか 「『CGCGATTATAATAGC』という並び順であればこの固体は花が好きだ」などと言ったところでしょうか。 少し説明しにくいですが、科学者がその塩基配列を見れば、この固体は眼が青いな、等というふうに解ったり・・・。 (2)、それとも、塩基配列だけではやはり固体の特徴までは解らなく、もしそうだとしたら、 どこまでの情報が分かるのでしょうか。 (3)、それとも(1)でも(2)でもなく、僕の考えはやはり見当違いな考えでしょうか。 どなたかご存じの方いらっしゃいましたら、ぜひ宜しくお願いします! ※非常に大ざっぱで適当な例です・・・。

  • DBFlute でシーケンス値取得

    現在 DBFlute + Oracle で、学習を進めているのですが、 シーケンス(Sequence)についてわからない点がございます。 sequenceDefinitionMap.dfprop ファイルに、テーブルにひもづく Sequenceを1つ設定できるのはわかったのですが(主キー用など)、 1テーブルに対して複数のSequenceを設定できないのでしょうか。 主キーだけでなく、その他のカラムにもシーケンス値を 利用したい場合はどのように記述するのでしょうか。 (まさか外だしSQLにしないといけない?) ご存知の方がいらっしゃれば、ご教示よろしくお願いいたします。

  • シークエンス反応について

    シークエンス解析の際、 PCRで アニーリング50℃、伸長60℃の条件で行う必要があるらしいのですが、 なんででしょうか? いろいろと調べたのですが、 わかりませんでした。 ご存知のかたよろしくお願いいたします。