• 締切済み

微生物同定16sRNA

微生物シークエンスでは、16sの可変領域の一部を増幅し同定する方法と、全長を解析する方法があります。その差について知りたいのですが、16s RNA全長を解析した方が同定精度が良くなる、という理解でよろしいのでしょうか。よろしくお願いします。

みんなの回答

回答No.5

無事に起動出来たようですね。おめでとうございます。 おそらく、Clostridium属10種のデータを集めたのかと思いますが、これに近縁なBacilus属10種を追加して、アライメント後、★印情報を眺めると、大変おもしろいことが分かります。 別の属を追加しても、★印が連続した配列が残っていることでしょう。その一方で、属ごとに共通した配列も発見出来るかと思います。 今回は3種類のデータの取得方法です。 (1)clustal x を起動し、テキストファイルの16Sデータをアライメントさせます。4色カラーの塩基配列で、一番左側(5'側と呼びます)に注目します。5'側から右へと順番に眺めると、★印が7つ以上(妥協して5つ以上でも良いです)並んだ場所を探します。clustal xを消さないまま、テキストデータを開き、★印が連続した塩基配列を検索画面に打ち込み、データ中の★印塩基配列を検索します。そして、その★印連続塩基配列より左側の塩基配列を思い切って削除します(もったいないので、別保存が良いです)。同様に、一番右側(3'側と呼びます)に注目し、3'側から左へと行き、★印が7つ以上続いた部分を探し、先程と同様に、その右側を思い切って消去します。これで、各種細菌の16Sの塩基配列の差を比較するために、(比較するための)両端の揃った一番長い塩基配列を入手することが出来ました。その一つの細菌種データの塩基配列をコピペして、ワードにペーストして、塩基数をカウントし、保存名として、「1357bp.txt」などとして下さい。そのテキストファイルを合計3 つ作っておいて下さい。その内、二つのファイルだけ、以下のようにいじります。 (2)再び、clustalx で、その新しいテキストファイルを開き、先述の操作で★印を出させます。当たり前ですが、末端で★印が連続していますよね。再び、5'側から右へと順番に眺めると、所々で★印が連続した場所があることでしょう。10種だけの情報なので、おそらく、★印の連続が恐ろしいことになっているかもしれません。4色カラーの塩基配列の下に"ruler"と書かれた数字が続いていますね。大体、300~500ぐらいの数字のところにある連続した★印を見つけて、テキストファイルのその左側の情報を全て消去します。これで、16S rRNA gene の前半部分の一部の塩基配列を入手することが出来ました。これを名前(5-300bp.txtなど)を付けて保存します。 (3)同様に、3'側で、16S rRNA gene の後半部分の一部の塩基配列を入手し、名前(300bp-3.txtなど)を付けて保存します。 これで、精度の差を数値として見るための、比較対象が3種類揃いました。3種類のテキストファイルが得られたら、教えて下さい。次は系統樹の作成です。

verify
質問者

補足

アライメントおもしろいです。準備できました。引き続き宜しくお願いします。

回答No.4

verifyさん C.acetobutylicum (ATCC 824, T) 16S rRNAの方は、Clostridium acetobutylicum の項目で、[Go to lower taxa]をクリックしてさらにもう一段階掘り下げると出て来ますよね。これは恐らく、ATCC 824, TがC.acetobutylicumの公式株と言いますか、論文などでその性質が良く知られ、入手可能な株だと考えられます。一方、Clostridium acetobutylicum partial 16S rRNA gene, strain 6 MSUは、Clostridium acetobutylicum の項目で、それ以上掘り下げずに「GO TO ARSA」をクリックすると、verifyさんのおっしゃる通り16S rRNAの後ろにgeneがつかなかったり、株名が省略されているものがありますよね。これらは、ひとくくりにC.acetobutylicumの16S rRNA geneだと考えて下さい。次の段階に移り、慣れてきて、色々な人の塩基配列の結果を見比べられるようになりますと、人によって?、国によって?、あるいは時代によって?、登録の記入が少しマチマチな点に気付くようになります。 さて、次の段階ですが、 (1)それぞれの塩基配列を整理(アライメント)するソフトclustalx( http://www.softpedia.com/get/Science-CAD/Clustal-X.shtml ) をダウンロードします。 (2)clustalxを起動し、File にある Load Sequences を選ぶと、Choose a File というポップアップメニューが出て来ますので、作成したテキストファイルを選びます。4 色の塩基配列が出現したら成功です。 (3)もしも出てこない場合;(パターンa) テキストファイルの >Clostridium-acetobutylicum-AM231182 の文字を長いので、>Cacetobutylicum-AM231182 などと短めにする。ちなみに 単語と単語の間は必ず "-"を入れて下さい。(パターンb)>Clostridium-acetobutylicum-AM231182 をさらに改行して、塩基配列の間に一行空間を入れてみる。 (4)さて、いよいよ。Alignment にある Do Complete Alignment を選びます。 (5)4色の塩基配列の上に★マークが出て来ましたか?★マークは、その10種は皆同じ位置に同じ塩基を持っている(であろう)ことを示します。 出て来たら、教えて下さい。 今回は、おもしろさを実感する段階だと思います。 次は、いよいよ計算に挑戦(あるいはその一歩手前)です。 ※ clustalxがダウンロード出来ない場合、他のサイトを検索して、なんとか自力で起動出来るまでにしてください。数個試すと、必ず、自分にあったソフトに出会います。

verify
質問者

補足

ClustalXで読み込ませました。塩基配列の共通点の★マークを確認しました。引き続き宜しくお願い致します。

回答No.3

verifyさん  そうです。blast検索に近いものがあります。 手順を示します。 まずはデータ取得の手順を示します。例として、Clostridium属でのデータ取得を説明します。 (1)DDBJのTXSearch(http://txsearch.ddbj.nig.ac.jp/top-j.html)に行って、検索枠に Clostridium属 (調べたい属) と打ち込み、横の「完全一致」を「部分一致」に変えて、検索ボタンを押します。 (2)画面が変わります。Taxonomic name: ★ [genus , scientific name] ★の部分に出て来たClostridium属をクリックします。 (3)画面が変わります。[Go to lower taxa]をクリックしましょう。 (4)ポップアップ画面が出て来ます。例えば、2番目の「Clostridium acetobutylicum 」をクリックします。 (5)ポップアップ画面が出て来ます。 Go to ARSA という白いボタンを押します。 (6)wait と出て来ます。待ちましょう。いろいろな遺伝子の塩基配列情報が出て来ます。16S rRNA geneと書かれた列を探します。1400bp以上の長いものです。例えば、一面目の下の方にある「AM231182」をクリックします。 (7)ポップアップ画面が出て来ます。情報が出て来ました。その前に、何でも良いので、テキストファイルを準備します。".txt"というファイルです。 (8)そのテキストファイルに以下のように書いて、おいておきます(ファスタ形式と呼ばれる書式です)。あとから、その空白の行に塩基配列データを入れます。 >Clostridium-acetobutylicum-AM231182 // (9)さきほどの青色の画面に戻り、下の方のORIGIN以下のすべての塩基配列(aggacg)を数字が含まれたまま、かまわずコピーします。 (10)DDBJのBLAST(http://blast.ddbj.nig.ac.jp/top-j.html)の検索枠にペーストします。 (11)ポップアップ画面(受付番号は、【○○○ー○○○】ですの画面)が出て来ます。> query以下に数字が消えた塩基配列が出て来ますので、それをコピーして、さきほどのテキストファイルの空白行にコピペします。 これで完了です。 それでは10種類ほどの同じ属の細菌種の情報を入手しましたら、一報下さい。 つぎは、塩基配列の整理です。 長い道のりですが検討を祈ります。

verify
質問者

お礼

ご丁寧にありがとうございました。sakasagitsunenさんの上手な導きについつい甘えてしまいました。思いがけない深掘りができて、大変うれしいです。勉強します。

verify
質問者

補足

ありがとうございます。早速10種類ほど作ってみました。ところで「Clostridium acetobutylicum」を「GO TO ARSA」すると、菌株違いのものも出てくるようですが、以下のように、 ・C.acetobutylicum (ATCC 824, T) 16S rRNA ・Clostridium acetobutylicum partial 16S rRNA gene, strain 6 MSU など16S rRNAの後ろにgeneがつかなかったり、属名が省略されているものが散見します。上記2点の例は同様に扱ってもよいものでしょうか。

回答No.2

verifyさん   数値を知りたいのですね。それも、そのような差を示した学術論文があるのがベストと言うことでしょう。私は知りません(短い断片はもっぱら長所の活用で用いております)。いや、さらにベストなのは、自分が知りたい属などが含む科内の細菌種全ての16S情報をデータベースからひっぱりだして計算するのが最強そうです。これは手持ちに持っていてもよさそうな気がしました。その方法はご存知でしょうか?

verify
質問者

補足

ありがとうございます。データベースとはNCBI blastのことでしょうか。計算方法について浅学にて知りません。よかったら教えて下さい。

回答No.1

verifyさん こんにちは ごぞんじかもしれませんが、16Sの全長(2000bp弱)の前半部分と後半部分に、それぞれ種の違いを比較的表現する領域があります。バチルス属など、同じ属の細菌種のみの16Sの情報をデータベースから集めて、(1)前半の一部(300bp)で系統樹を作成、(2)後半(300bp)の一部で系統樹を作成、(3)全長ではなくとも1500bp以上で系統樹を作成、のそれぞれを見比べてみますと、近縁種の中にはどうしても同じ塩基配列のものが、(3)に比べて(1)や(2)の方が多くなります。ゆえに、verifyさんの言う通りです。16s RNA全長を解析した方が同定制度が良くなります。

verify
質問者

補足

ありがとうございます。一般的に精度がどの程度異なっているのかご存じでしょうか。