• 締切済み

バイオインフォマティクスに詳しい方

今回、次世代シークエンサーを使ってRNAseqを行いました。(委託) そこで、委託会社のほうで解析をしていただき、exelファイルで発現量変化がわかるようになっています。 そこで、geneID(今回はマウスなのでNM_........のように)で表示されています。 このgeneIDをもとに遺伝子の名前を全てにつけたいのです。 例えば、NM_000001はAkt1みたいな感じにexelファイルにしたのです。 バイオインフォマティクスの知識がほとんどないので地道に一つずつやっていくぐらいしか方法が思い浮かびません。 どなたがバイオインフォマティクスに精通している方ご教授いただけないでしょうか?

みんなの回答

  • larme001
  • ベストアンサー率44% (271/608)
回答No.1

エクセルのタブファイルとかFASTA形式のリスト等になっているのであれば、オンラインの変換ツールを探してやるのが一番早いと思います。たとえば以下のHPは解析としてもそれなりに有名です。日本語ではないかもしれないので英語のサイトを検索してみてください。 http://david.abcc.ncifcrf.gov/ 目的に完全にあった一括返還をできるプログラムが見つからない場合は、自前で簡単なプログラムを作製するしかありません。Pealとかが得意なんじゃないでしょうか?そこそこかじったことがある人だったらたぶん対応できると思います。それさえ完全にチンプンカンプンという場合は、知り合いでそういうデータを扱ったことのある人にお願いするとか、あるいは金払って委託した業者にrefseqのIDじゃないものに変換してくれとお願いするしかないんじゃないかなあと思います。 まああとは、その段階でつまづくということはRNAseqの結果自体を全体的に見てパスウェイ解析などをするのも難しいでしょうから、その辺を含めてどっかと共同研究にしてしまうとか。

関連するQ&A

  • バイオインフォマティクス分野でのグリッドコンピューティングの利用可能範囲について

    現在、バイオインフォマティクス分野でのグリッドコンピューティングでの解析について調べています。グリッドコンピューティングでは、並列分散処理が可能な解析は得意だが、直列処理(流体力学等)には不向きだとところまではわかりました。 それでは、具体的にはどのような解析に向いておりで、どのような解析が不向きなのでしょうか。 バイオ分野での解析なので、 ・DNA配列解析 ・遺伝子発現解析 ・SNPs解析 ・たんぱく質構造解析 ・たんぱく質機能解析 ・分子ネットワーク解析 等の分類の中で、どのような解析に置いてどのような処理が可能か、不可能か、とくに、直列処理でしかできない解析の具体例をお教えいただきたいと思います。 スパコンとグリッドはどちらが優れているのかを考えるために用いようと思っております。 よろしくお願いします

  • 酸素代謝の研究をしている者です。

    酸素代謝の研究をしている者です。 ある通性嫌気細菌のカタラーゼの遺伝子発現を調べたところ、好気条件より嫌気条件において発現量が増す結果となりました。 カタラーゼは過酸化酸素の毒性から生体を守るもので、好気条件で発現が増すものだと理解していました。 このように、カタラーゼ発現が嫌気条件で増加する例をご存知でしょうか?情けないことにバイオインフォマティクスにはてんで疎く、参考にすべき論文を見出だすことが出来ませんでした… 大変恐縮なのですが、どうぞお力添えをお願い致します。

  • 今日は八月一日(金)です。と言えば

    例のSTAP細胞検証実験の中間発表の時期となってきました。 ドンナ発表になるのか?私は”STAP細胞は存在する”と思っています。 理由は、いままで、調査委員会は論文不正、捏造を断罪しました。 しかし、そのどれをとっても、”存在しない”ことを証明する 決定的なものではありません。 あのグリーンに発光するOct4_GFPの発現は”STAP細胞”なのです。 STAP細胞はES細胞と性質が近いのです。だからES細胞と見間違えているのです。 Oct4_GFPのときこれを遺伝子解析します。 STAP幹細胞のとき、また遺伝子解析をします。 胎盤と胎児の体細胞の遺伝子解析をします。 キメラマウスの遺伝子解析をします。 これをやっていれば、こんな混乱は起こらなかったと思うが やっていないのよね。

  • バイオインフォマティクスって??

    現代のバイオインフォマティクスにはさまざまな説があるらしいのですが、いまのところの正しい説を教えてほしいです(>人<)!!

  • リアルタイムPCRについての質問です。

    PCRまったくの初心者です。 cDNAを作成してそこからRT-PCRを回して解析するという方法をとっています。 前任者の引き継ぎで、比較する検体を追加して解析する必要があるのですが、 前回前任者が用いていた陰性コントロール(A群)をPCRにかけてところ、Ct値が検出されませんでした。 プライマー・プローブなどはまったく同じでA群のCt値だけ出ず、最近採取した検体からはCt値が出ています。 以前(2年前)作成され、-20℃で保管されていた検体を用いたのですが、失活してしまったということなのでしょうか? また、この場合当時の陰性コントロールの遺伝子発現量と今回採取した検体との間で遺伝子発現を比較することはできないのでしょうか?

  • 医療統計解析について

    私はCYPの遺伝子多型に関する研究をしています。具体的に言うと、CYPの多型とある薬の副作用である肝障害との関連性を製薬会社と共同研究しています。現在までにその薬を服用していた患者(100例以上)のゲノムDNAを用いて、CYPの発現量等に関連があると疑われる多型領域を標的としてgenotypingし、その結果をもと に統計解析を行っている次第です。 現在は、genotypeと肝障害の有無を解析していますが、今後はallele頻度でも解析をしてほしいとの要望があり、試行錯誤しております。allele頻度で解析する場合はgenotypeで解析する場合とどのように違ってくるのか、もし何かアドバイスなどございましたら宜しくお願い致します。

  • バイオインフォマティクスを研究に活かすには?

    現在生物の大学院に在籍している者です。 今後就職してバイオインフォマティクスの職種に就こうと思っています。そして、しばらく何年か働いた後、大学なり研究機関なりで、またバイオの研究に戻りたいと考えています。 ここで質問なのですが、多くのバイオインフォマティクスをやっている企業では、SNPのソフト開発やデータベース構築業務をやっているところが多いのですが、このような仕事が、将来新しい遺伝子の探索や創薬のシーズ探し、そして大学などで行われている研究に活かしていくことができるのかがすごく知りたいです。 誰かご存じの方よろしくお願いいたします。

  • バイオインフォマティクスについての問題です。

    バイオインフォマティクスの問題です。 下記の問題が考えてもわかりませんでした。 良ければ説明と解答をお願いします。 下記の5つのアミノ酸配列のうち次のPROSITEパターンにマッチしうる配列をすべて見つけだし、記号で答えよ。 パターン:C-x(2,3)-C-[IVM]-H-x(2,3)-H. (1) アミノ酸配列1:CDFPCVHKISH (2) アミノ酸配列2:CWDCIHFIDH (3) アミノ酸配列3:CWDCMHIDSNH (4) アミノ酸配列4:CLYPCVHIQH (5) アミノ酸配列5:CDLCAHLRIH また上のPROSITEパターンと検索する有限オートマトンを設計せよ。

  • 年金機構の情報流出。セキュリテーは?

    今回の流出は添付ファイルを開いたことが原因です。 そもそも、セキュリテー会社を介しているのに、すり抜けたウイルス。 いたちごっこは解りますが、そうすると今回はセキュリテー会社も、プロバイザーも判断できなかった最新のウイルスってことでしょうか? なら、莫大な費用をかけてセキュティー会社に委託するのは無意味ではないでしょうかね? 精通されている方のご意見をお聞きしたいです。

  • トランスジェニックマウスの解析方法について教えて下さい。

    度々の質問で失礼致します。 解析を行いたいTgマウスは、マウスにも既に内在する分子(仮にAとします)をさらに過剰発現させる為にhumanの同一分子を導入した物です(homologyは相当高くほとんど同じです。) human,mouseの両方のA分子に反応する抗体を用い、W.Bで内部標準にActinを用い、bandの濃さでA/Actinの比率でTgとnon Tgの差を見たのですが一応差があるかな…という結果でした。 こういった解析方法は正しい物なのでしょうか? また、RT-PCRでmRNAの発現を確認しようと思ったのですがhuman, mouse両方にかかるprimerだと差が見られず、A分子中の塩基配列で唯一異なる部位にsense primerを作り、anti sense primerにはDNA injectionの際の3’末端側に挿入したSV40 polyAの部分の配列を用いようと思っています。 基本的な事で申し訳ないのですが、転写の際にはSV40polyAが導入遺伝子のmRNAのpolyAとしてくっついてくると考えてよいのでしょうか? どなたか御意見下されば幸いです。 宜しくお願い致します。