SMILSと官能基の判定方法とフリーのソフトの存在
- SMILES形式で表された化合物の中に特定の官能基が含まれているかを判断する方法はありますか?
- 特定の官能基(カルボキシル基、アミノ基、フェノール、オキシム、メチル基など)が含まれているかどうかを判定することは可能ですか?
- フリーのソフトウェアで特定の官能基の有無を判定することができるものは存在しますか?
- ベストアンサー
SMILSと官能基
COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O のようなSMILESで書かれたデータがあるのですがこれらの中に特定の官能基が含まれているかを判断することは可能なのでしょうか。 例えば CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)Nの中にカルボキシル基、アミノ基、フェノール、オキシム、メチル基などが含まれているかどうかを判断する方法は存在するのでしょうか。 また、そのようなフリーのソフトはあるのでしょうか。
- dfadsfadad
- お礼率38% (41/106)
- 化学
- 回答数6
- ありがとう数5
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
慣れた人なら見ただけで判断することができるのかもしれませんけど、機械に任せたほうが楽だと思います。 http://www.daylight.com/daycgi/depict?43313d4e43323d432843283d4e31294e294e3d434e3243334328432843284f3329434f294f294f
その他の回答 (5)
- 101325
- ベストアンサー率80% (495/617)
> 間に&や.を置いてもちょっと上手くいかないのですが、何かわかりますでしょうか? [C;X4;!H0]-[O;X2;H0].[N;X3;!H0] でとってくることができるはずなんですけど……上手くいきませんね。 http://openbabel.org/wiki/SMARTS の Limitations of the Open Babel SMARTS Implementation をみると (C).(C) がだめだ、と書いてありますが C.C もだめみたいです。 データ数が少なければ、daylightのサイトにあるDepict SMARTS Match http://www.daylight.com/daycgi_tutorials/depictmatch.cgi を使うという手もありますけど、2回に分けてコンバートするのが手っ取り早い解決策だと思います。
お礼
ありがとうございます。 やっぱり無理みたいですね。 2回にわけてやったほうが良さそうなのでそのようにしたいと思います。 ご丁寧な解説をどうもありがとうございました。
- 101325
- ベストアンサー率80% (495/617)
> pythonと書かれているのでプログラミング言語がpythonで書かれたソフトなのだということはわかるのですが、何を実行するためのソフトなのでしょうか。 http://openbabel.org/wiki/Python の How to install と How to use を読む限りでは、Python から Open Babel を使うためのモジュール(っていっていいんでしょうか?私はPythonを使ったことがないので正しい呼び方はわかりません)のようですね。Python を使う人でなければ、必要のないものです。 OpenBabelGUI から Open Babel を使うなら、インストールする必要はありません。
補足
ありがとうございます。 それではこれは必要なさそうですね。 Open Babelを使うことができました。ところで、これの使用方法なのですが、2つの構造をconvert only molecule matching SMARTSに入れることは可能でしょうか。例えば [C;X4;!H0]-[O;X2;H0]と[N;X3;!H0]の構造を含む化合物郡をとってくることはできるのでしょうか。間に&や.を置いてもちょっと上手くいかないのですが、何かわかりますでしょうか? 使用方法が詳しく書いてあるページを教えていただけないでしょうか。 度々の質問申し訳ありません。よろしくお願い致します。
- 101325
- ベストアンサー率80% (495/617)
#3です。 すみません。思い出しました。クリックして画面が切り替わった後、ダウンロードが始まるまで少し時間がかかるのですけど、その待っている間に画面のどこかをクリックしてしまうと、個人情報を聞かれたような気がします。 入力する必要はありません。よく読むとどこかに、入力しなくてもダウンロードできるよ。と書いてあるはずです。
補足
ありがとうございます。 なんとかダウンロードはできました。 まだちょっと不慣れでいまいちよくわからないのですが、試してみたいと思います。 あと、少しお聞きしたいのですが、 ページの Open Babelをクリックするとopenbabel-python-1.5.py2.6.exeがダウンロードされるのですがこれはどういったソフトなのでしょうかpythonと書かれているのでプログラミング言語がpythonで書かれたソフトなのだということはわかるのですが、何を実行するためのソフトなのでしょうか。 何度も質問をして申し訳ありません。
- 101325
- ベストアンサー率80% (495/617)
> OpenBabelGUIをダウンロードしようとしたのですが、 > いろいろ個人情報を記入しなくてはならないところがあって、 えっ、本当ですか?私の場合は http://openbabel.org/wiki/Install の Windows OpenBabelGUI Provides a graphical user interface for Open Babel, as well as a command-line interface. This is what most users are looking for. Download v2.2.3 Installer ← これ をクリックしただけで(ほぼ自動的に)インストールできましたが... 個人情報を聞かれることは、なかったです。
- 101325
- ベストアンサー率80% (495/617)
> ...のようなSMILESで書かれたデータがあるのですがこれらの中に特定の > 官能基が含まれているかを判断することは可能なのでしょうか。 > やはり、構造式を二次元化して一つ一つを見ていくしかないのでしょうか。 ちょっと探してみたら、こんなソフトがありました。 OpenBabelGUI http://openbabel.org/wiki/OpenBabelGUI SMILESで書かれたデータから、SMARTSというのを使って必要なデータを抽出することができるようです。ためしに質問文にあるデータからカルボキシル基を含む分子を O=C[OH] で抽出したら、該当する二分子だけを抽出することができました。数千ものデータでどうなるかは分かりませんが、試してみる価値はあるのではないでしょうか。 SMARTSの文法については、ウィキペディアなどを参考にしてください。SMILESをご存知でしたら、それほど難しくはないと思います。 Smiles ARbitrary Target Specification (SMARTS) http://en.wikipedia.org/wiki/Smiles_arbitrary_target_specification
お礼
ありがとうございます。 試しにやってみたいと思います。 わざわざフリーのソフトまで紹介していただいてありがとうございました。
補足
OpenBabelGUIをダウンロードしようとしたのですが、いろいろ個人情報を記入しなくてはならないところがあって、これは記入した方がよろしいのでしょうか。記入しないと手に入らないみたいなのですが… パソコンは初心者でよくわからないのですが、一応そのような個人情報は記入はするが、フリーのソフトと解釈してよろしいのでしょうか。
関連するQ&A
- 官能基の数を数える
官能基の有無を調べるソフトにOpenBabelなどありますが、 特定の官能基の有無はわかるのですが、その数を指定することはできる のでしょうか。 たとえば[OH]が5つ存在するものをSMILESとうからとって来れるのでしょうか。 COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O 例えばこれらのデータから[OH]が2つ以上含む化合物は判別できますでしょうか。
- ベストアンサー
- 化学
- 【化学・官能基】化学の官能基について質問です。
【化学・官能基】化学の官能基について質問です。 官能基 ーOーH という形があります。 同じ原子構造なのに、ヒドロキシ基アルコールとヒドロキシ基フェノールがあるのはどういう違いがあって別の物質になっているのですか?
- ベストアンサー
- 化学
- 官能基を逆に書くとき
有機化合物などの官能基を左側に書くときに、 参考書を見ると、カルボキシル基はCOOHをHOOC、ヒドロキシ基はOHをHOと書いてあるのですが、 メチル基はCH3のまま書いてあるのですが、どうしてH3Cとはならないのですか?
- ベストアンサー
- 化学
- 電子吸引性の官能基について
ビニル基-C=Cやカルボキシル基-COOHは電子吸引性の官能基ということは分かるのですが、-OCORはどちらを示すのでしょうか? また、-OCOC-C=Cのようなアクリロイル基は、ビニル基-C=Cと比べ、電子吸引性はどう変わってくるのでしょうか? よろしくお願いします。
- 締切済み
- 化学
- ▲▲官能基のまとめ▲▲
有機化学を学んでいる者です。 官能基のケトン基・エーテル基について質問です。 教科書などケトン基やエーテル基の表し方を、 R-CO-RやR-O-R、としていますが自分としては C-CO-CやC-O-Cとするのがいいと思います。 ケトン基やエーテル基はRの部分がCであるときに呼ばれるので Rでは《REST;残部》であるため、常に(炭化水素基である)とは 思えないのでR→Cとした方がいいと思った次第です。 しかし、どの教科書(マクマリーなど)を見ても明記されていません。 もっと大切な事があるとおもいますが、気になります。 よろしくお願いします。
- 締切済み
- 化学
- SMILESを二次元に描画する
以下のようなSMILESデータがあるのですが、これを 複数の構造を一度に見たいのですが、以下の9つの構造を一度に二次元に表示するフリーのソフトはあるのでしょうか。 CC(=O)OC1C2C(C(C(=O)O2)OC(=O)C)OC1=O CC(=O)NC(CCC(=O)N)C(=O)[O-] CC(=O)NC1=NN=C(S1)S(=O)(=O)N CC(=O)OCC[N+](C)(C)C CC(=O)NC(CS)C(=O)O CCC(C1=CC=CC=C1)C(=O)NC(=O)NC(=O)C CC(=O)NC1=CC=C(C=C1)O CC(=O)C1=CC=C(C=C1)S(=O)(=O)NC(=O)NC2CCCCC2 CCCC(=O)NC1=CC(=C(C=C1)OCC(CNC(C)C)O)C(=O)C
- ベストアンサー
- 化学
- この官能基の名前はなんでしょうか? CH3CHOH
H H || H-C-C-O-H || H うまく表示されてるといいのですが… ↑の官能基の名前をご存知の方はいらっしゃいますか? 調べたのですが見つけることができませんでした。 また、官能基の名前が分からなかったりするときには何で調べればいいのでしょうか? 一応IUPACの置換基一覧で調べるのですが、乗ってないものも多くあまりみつかりません
- ベストアンサー
- 化学
補足
ありがとうございます。 やはり、構造式を二次元化して一つ一つを見ていくしかないのでしょうか。実はSMILESデータは、上記には8個書きましたが数千ものデータを見ていくのは大変な労力がかかります。 例えば、S(=O)(=O)が含まれていたらスルホ基があると判断するといったようなルールは存在するのでしょうか。