SMILSと官能基の判定方法とフリーのソフトの存在

このQ&Aのポイント
  • SMILES形式で表された化合物の中に特定の官能基が含まれているかを判断する方法はありますか?
  • 特定の官能基(カルボキシル基、アミノ基、フェノール、オキシム、メチル基など)が含まれているかどうかを判定することは可能ですか?
  • フリーのソフトウェアで特定の官能基の有無を判定することができるものは存在しますか?
回答を見る
  • ベストアンサー

SMILSと官能基

COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O のようなSMILESで書かれたデータがあるのですがこれらの中に特定の官能基が含まれているかを判断することは可能なのでしょうか。 例えば CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)Nの中にカルボキシル基、アミノ基、フェノール、オキシム、メチル基などが含まれているかどうかを判断する方法は存在するのでしょうか。 また、そのようなフリーのソフトはあるのでしょうか。

  • 化学
  • 回答数6
  • ありがとう数5

質問者が選んだベストアンサー

  • ベストアンサー
  • 101325
  • ベストアンサー率80% (495/617)
回答No.1

慣れた人なら見ただけで判断することができるのかもしれませんけど、機械に任せたほうが楽だと思います。 http://www.daylight.com/daycgi/depict?43313d4e43323d432843283d4e31294e294e3d434e3243334328432843284f3329434f294f294f

参考URL:
http://ja.wikipedia.org/wiki/SMILES%E8%A8%98%E6%B3%95#.E5.A4.96.E9.83.A8.E3.83.AA.E3.83.B3.E3.82.AF
dfadsfadad
質問者

補足

ありがとうございます。 やはり、構造式を二次元化して一つ一つを見ていくしかないのでしょうか。実はSMILESデータは、上記には8個書きましたが数千ものデータを見ていくのは大変な労力がかかります。 例えば、S(=O)(=O)が含まれていたらスルホ基があると判断するといったようなルールは存在するのでしょうか。

その他の回答 (5)

  • 101325
  • ベストアンサー率80% (495/617)
回答No.6

> 間に&や.を置いてもちょっと上手くいかないのですが、何かわかりますでしょうか? [C;X4;!H0]-[O;X2;H0].[N;X3;!H0] でとってくることができるはずなんですけど……上手くいきませんね。 http://openbabel.org/wiki/SMARTS の Limitations of the Open Babel SMARTS Implementation をみると (C).(C) がだめだ、と書いてありますが C.C もだめみたいです。 データ数が少なければ、daylightのサイトにあるDepict SMARTS Match http://www.daylight.com/daycgi_tutorials/depictmatch.cgi を使うという手もありますけど、2回に分けてコンバートするのが手っ取り早い解決策だと思います。

dfadsfadad
質問者

お礼

ありがとうございます。 やっぱり無理みたいですね。 2回にわけてやったほうが良さそうなのでそのようにしたいと思います。 ご丁寧な解説をどうもありがとうございました。

  • 101325
  • ベストアンサー率80% (495/617)
回答No.5

> pythonと書かれているのでプログラミング言語がpythonで書かれたソフトなのだということはわかるのですが、何を実行するためのソフトなのでしょうか。 http://openbabel.org/wiki/Python の How to install と How to use を読む限りでは、Python から Open Babel を使うためのモジュール(っていっていいんでしょうか?私はPythonを使ったことがないので正しい呼び方はわかりません)のようですね。Python を使う人でなければ、必要のないものです。 OpenBabelGUI から Open Babel を使うなら、インストールする必要はありません。

dfadsfadad
質問者

補足

ありがとうございます。 それではこれは必要なさそうですね。 Open Babelを使うことができました。ところで、これの使用方法なのですが、2つの構造をconvert only molecule matching SMARTSに入れることは可能でしょうか。例えば [C;X4;!H0]-[O;X2;H0]と[N;X3;!H0]の構造を含む化合物郡をとってくることはできるのでしょうか。間に&や.を置いてもちょっと上手くいかないのですが、何かわかりますでしょうか? 使用方法が詳しく書いてあるページを教えていただけないでしょうか。 度々の質問申し訳ありません。よろしくお願い致します。

  • 101325
  • ベストアンサー率80% (495/617)
回答No.4

#3です。 すみません。思い出しました。クリックして画面が切り替わった後、ダウンロードが始まるまで少し時間がかかるのですけど、その待っている間に画面のどこかをクリックしてしまうと、個人情報を聞かれたような気がします。 入力する必要はありません。よく読むとどこかに、入力しなくてもダウンロードできるよ。と書いてあるはずです。

dfadsfadad
質問者

補足

ありがとうございます。 なんとかダウンロードはできました。 まだちょっと不慣れでいまいちよくわからないのですが、試してみたいと思います。 あと、少しお聞きしたいのですが、 ページの Open Babelをクリックするとopenbabel-python-1.5.py2.6.exeがダウンロードされるのですがこれはどういったソフトなのでしょうかpythonと書かれているのでプログラミング言語がpythonで書かれたソフトなのだということはわかるのですが、何を実行するためのソフトなのでしょうか。 何度も質問をして申し訳ありません。

  • 101325
  • ベストアンサー率80% (495/617)
回答No.3

> OpenBabelGUIをダウンロードしようとしたのですが、 > いろいろ個人情報を記入しなくてはならないところがあって、 えっ、本当ですか?私の場合は http://openbabel.org/wiki/Install の Windows  OpenBabelGUI   Provides a graphical user interface for Open   Babel, as well as a command-line interface.   This is what most users are looking for.    Download v2.2.3 Installer ← これ をクリックしただけで(ほぼ自動的に)インストールできましたが... 個人情報を聞かれることは、なかったです。

  • 101325
  • ベストアンサー率80% (495/617)
回答No.2

> ...のようなSMILESで書かれたデータがあるのですがこれらの中に特定の > 官能基が含まれているかを判断することは可能なのでしょうか。 > やはり、構造式を二次元化して一つ一つを見ていくしかないのでしょうか。 ちょっと探してみたら、こんなソフトがありました。 OpenBabelGUI http://openbabel.org/wiki/OpenBabelGUI SMILESで書かれたデータから、SMARTSというのを使って必要なデータを抽出することができるようです。ためしに質問文にあるデータからカルボキシル基を含む分子を O=C[OH] で抽出したら、該当する二分子だけを抽出することができました。数千ものデータでどうなるかは分かりませんが、試してみる価値はあるのではないでしょうか。 SMARTSの文法については、ウィキペディアなどを参考にしてください。SMILESをご存知でしたら、それほど難しくはないと思います。 Smiles ARbitrary Target Specification (SMARTS) http://en.wikipedia.org/wiki/Smiles_arbitrary_target_specification

dfadsfadad
質問者

お礼

ありがとうございます。 試しにやってみたいと思います。 わざわざフリーのソフトまで紹介していただいてありがとうございました。

dfadsfadad
質問者

補足

OpenBabelGUIをダウンロードしようとしたのですが、いろいろ個人情報を記入しなくてはならないところがあって、これは記入した方がよろしいのでしょうか。記入しないと手に入らないみたいなのですが… パソコンは初心者でよくわからないのですが、一応そのような個人情報は記入はするが、フリーのソフトと解釈してよろしいのでしょうか。

関連するQ&A

  • 官能基の数を数える

    官能基の有無を調べるソフトにOpenBabelなどありますが、 特定の官能基の有無はわかるのですが、その数を指定することはできる のでしょうか。 たとえば[OH]が5つ存在するものをSMILESとうからとって来れるのでしょうか。 COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O 例えばこれらのデータから[OH]が2つ以上含む化合物は判別できますでしょうか。

  • 官能基

    例えば、問題として  R-C-O-H    ||    O の化合物のなかにある官能基を書けという問題の場合、カルボキシル基のみが 正解になりますか?(R内は無視として) それともカルボキシル基とヒドロキシル基ですか? つまり、一番大きい結合のみを答えるかということです。 カルボキシル基ということは、かならずOHがあるということなので、あえて 答える必要はないと私は思っているのですが・・・

  • 官能基

    次の官能基が酸性か塩基性かを見分けたいんですが、 やり方がわかりません…;; 教えてください!! ・エステル結合 ・カルボニル基 ・カルボキシル基 ・ニトリル基 ・ラクトン(環状エステル) ってどう分けられますか?? よろしくお願いします!! よかったら… フェノールって何で弱酸性なんですか?? スルホン酸(非常に強い酸性)は共鳴式が3つ カルボン酸(強い酸性)は共鳴式が2つ書けるから 共鳴式の数が多い方が酸性が強くなるのかなと思ってたんですが・・ フェノールは3つは共鳴式が書けるんです… 何個もすいません・・ よろしくお願いします!!>_<;;

  • 【化学・官能基】化学の官能基について質問です。

    【化学・官能基】化学の官能基について質問です。 官能基 ーOーH という形があります。 同じ原子構造なのに、ヒドロキシ基アルコールとヒドロキシ基フェノールがあるのはどういう違いがあって別の物質になっているのですか?

  • 官能基を逆に書くとき

    有機化合物などの官能基を左側に書くときに、 参考書を見ると、カルボキシル基はCOOHをHOOC、ヒドロキシ基はOHをHOと書いてあるのですが、 メチル基はCH3のまま書いてあるのですが、どうしてH3Cとはならないのですか?

  • 電子吸引性の官能基について

    ビニル基-C=Cやカルボキシル基-COOHは電子吸引性の官能基ということは分かるのですが、-OCORはどちらを示すのでしょうか? また、-OCOC-C=Cのようなアクリロイル基は、ビニル基-C=Cと比べ、電子吸引性はどう変わってくるのでしょうか? よろしくお願いします。

  • 構造式と官能基

    ブドウ糖の化学式はC6H12O6ですよね?? では構造式はどうなるんでしょう?? ちなみに官能基も分かれば嬉しいです!! すいませんが、協力お願いします!!

  • ▲▲官能基のまとめ▲▲

    有機化学を学んでいる者です。 官能基のケトン基・エーテル基について質問です。 教科書などケトン基やエーテル基の表し方を、 R-CO-RやR-O-R、としていますが自分としては C-CO-CやC-O-Cとするのがいいと思います。 ケトン基やエーテル基はRの部分がCであるときに呼ばれるので Rでは《REST;残部》であるため、常に(炭化水素基である)とは 思えないのでR→Cとした方がいいと思った次第です。 しかし、どの教科書(マクマリーなど)を見ても明記されていません。 もっと大切な事があるとおもいますが、気になります。 よろしくお願いします。

  • SMILESを二次元に描画する

    以下のようなSMILESデータがあるのですが、これを 複数の構造を一度に見たいのですが、以下の9つの構造を一度に二次元に表示するフリーのソフトはあるのでしょうか。 CC(=O)OC1C2C(C(C(=O)O2)OC(=O)C)OC1=O CC(=O)NC(CCC(=O)N)C(=O)[O-] CC(=O)NC1=NN=C(S1)S(=O)(=O)N CC(=O)OCC[N+](C)(C)C CC(=O)NC(CS)C(=O)O CCC(C1=CC=CC=C1)C(=O)NC(=O)NC(=O)C CC(=O)NC1=CC=C(C=C1)O CC(=O)C1=CC=C(C=C1)S(=O)(=O)NC(=O)NC2CCCCC2 CCCC(=O)NC1=CC(=C(C=C1)OCC(CNC(C)C)O)C(=O)C

  • この官能基の名前はなんでしょうか? CH3CHOH

      H H   || H-C-C-O-H              ||   H うまく表示されてるといいのですが… ↑の官能基の名前をご存知の方はいらっしゃいますか? 調べたのですが見つけることができませんでした。 また、官能基の名前が分からなかったりするときには何で調べればいいのでしょうか? 一応IUPACの置換基一覧で調べるのですが、乗ってないものも多くあまりみつかりません