官能基の数を数える方法とは?

このQ&Aのポイント
  • 質問者は、特定の官能基の有無だけでなく、その数も知りたいという疑問を持っています。
  • 例えば、与えられた化合物から[OH]が2つ以上含まれているかを判別することは可能なのでしょうか?
  • OpenBabelなどのソフトウェアを使用することで、官能基の数を数えることができます。
回答を見る
  • ベストアンサー

官能基の数を数える

官能基の有無を調べるソフトにOpenBabelなどありますが、 特定の官能基の有無はわかるのですが、その数を指定することはできる のでしょうか。 たとえば[OH]が5つ存在するものをSMILESとうからとって来れるのでしょうか。 COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O 例えばこれらのデータから[OH]が2つ以上含む化合物は判別できますでしょうか。

  • 化学
  • 回答数5
  • ありがとう数4

質問者が選んだベストアンサー

  • ベストアンサー
  • 101325
  • ベストアンサー率80% (495/617)
回答No.1

OpenBabelGUIを使う(あまりスマートではないけどとりあえず思いついた)やり方。 Add hydrogens (make explicit) と Output explicit hydrogens as such に チェックを入れて、質問文のデータをコンバートすると [CH3]Oc1c([cH][cH]c([cH]1)[CH2][CH]=[CH2])[OH] [CH3]C(=O)[NH]c1[cH][cH]c([cH][cH]1)[CH2]C(=O)[OH] [CH3][CH2]Oc1[cH]c2c(c3c([cH]c([cH][cH]3)[NH2])nc2[cH][cH]1)[NH2] [CH2]([CH]([CH]1C(=O)C(=C(O1)[OH])[OH])[OH])[OH] [CH3]C(=O)Oc1[cH][cH][cH][cH]c1C(=O)[OH] [CH3]C(=O)[NH]c1nnc(s1)S(=O)(=O)[NH2] [cH]1nc2c([nH]1)c(n[cH]n2)[NH2] [cH]1nc2c(c(n1)[NH2])n[cH]n2[CH]1[CH]([CH]([CH](O1)[CH2][OH])[OH])[OH] のように変換されますから、あとはPerlなどを使って各データの[OH]を数えればいいんじゃないかと思います。 ただし、このやり方だとカルボキシ基CO2Hやスルホ基SO3Hなどもヒドロキシ基OHとしてカウントされますので注意してください。

dfadsfadad
質問者

お礼

ありがとうございます。 [OH]の数を数えることはプログラム組めばできそうですね。 ちなみにカルボキシル基の場合はC(=O)[OH] スルホ基の場合は、S(=O)(=O)[OH], アミドやアミンの場合はどのような文字列で表示されるのでしょうか。 そもそも Add hydrogens (make explicit) と Output explicit hydrogens as such の処理は何を施しているのでしょうか。

その他の回答 (4)

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.5

すみません, 当然わかると思いますがヒドロキシルアミンは SMILES式だと NO ですね.

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.4

とりあえず突っ込むだけだとアレなので本題もちょっと考えてみる (苦笑). もとの SMILES式だけから調べようとすると, 「どのような構造が欲しいのか」をちゃんと考えないといけないし, 調べかたもその構造に依存するような感じがします. 例えばヒドロキシ基 1つをとっても, 「何がヒドロキシ基なのか」は意外と難しかったりします. 例えば NNO (ヒドロキシルアミン) の OH がヒドロキシ基か? って言われると微妙だし, ClO (次亜塩素酸) だともっと困る. まあヒドロキシ基は単純なので, 「構造が正しいかどうかは無視」「アルコールかフェノールかは気にしない」「互変異性は違うものとみなす」などいくつかの条件を付ければそれなりにできそうです. まず, 潜在的なヒドロキシ基に含まれる酸素を見付けます. これは「先頭の O で O(...)なんか という形でないもの」か「最後の O」か「O)」です. ここからその酸素につながる元素, さらにそこに隣接する元素を調べてチェックすれば多分 OK. 本質的にはアミンも同じことになります. アミドもできるといえばできるけどちょっと面倒な感じ. そろそろ「SMILES式からきちんと構造を作りあげる」必要がありそうです. ちなみに OpenBabel GUI で遊んでみた感じでは蟻酸がちょっといやなことになったような.

  • 101325
  • ベストアンサー率80% (495/617)
回答No.3

> Add hydrogens (make explicit) と > Output explicit hydrogens as such の処理は何を施しているのでしょうか。 #2さんの仰るとおり、見たまま字のままだと思います。よく分からなかったら、 CO [CH3]O C[OH] [CH3][OH] を入力データにして、チェックを入れたり外したりしたときに出力がどうなるかを試してみて下さい。 > アミドやアミンの場合はどのような文字列で表示されるのでしょうか。 結合の手が1本しかない1級アミド C(=O)[NH2] や1級アミン [NH2](ただし1級アミドも含まれる)を文字列で表すのは簡単です。しかし、結合の手が2本,3本になると、Perlなどの正規表現を使ったとしても、ひとつの文字列で表すのは無理なんじゃないかなと思います(少なくとも私には無理です、ごめんなさい)。 Daylightのページにあるように、SMARTS を使えば アミドは [NX3][CX3](=[OX1])[#6] アミン(一級または二級,アミドを含まない)は [NX3;H2,H1;!$(NC=O)] のように簡単に表すことができるのですが。 http://www.daylight.com/dayhtml_tutorials/languages/smarts/smarts_examples.html つきなみなアドバイスで申し訳ありませんが、ひとつの文字列で表すのにこだわらずに、SMARTSでやるところ、正規表現でやるところ、プログラムを組んでやるところ、手作業でやるところに適当に分けて、問題に取り組んだらいいんじゃないでしょうか。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.2

Add hydrogens (make explicit) とか Output explicit hydrogens as such とかを日本語に直せば分かるのでは? あるいは, 入力と出力を比較しても分かるはず. アミドやアミンは例の中にありますね.

関連するQ&A

  • SMILSと官能基

    COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O のようなSMILESで書かれたデータがあるのですがこれらの中に特定の官能基が含まれているかを判断することは可能なのでしょうか。 例えば CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)Nの中にカルボキシル基、アミノ基、フェノール、オキシム、メチル基などが含まれているかどうかを判断する方法は存在するのでしょうか。 また、そのようなフリーのソフトはあるのでしょうか。

  • 官能基

    例えば、問題として  R-C-O-H    ||    O の化合物のなかにある官能基を書けという問題の場合、カルボキシル基のみが 正解になりますか?(R内は無視として) それともカルボキシル基とヒドロキシル基ですか? つまり、一番大きい結合のみを答えるかということです。 カルボキシル基ということは、かならずOHがあるということなので、あえて 答える必要はないと私は思っているのですが・・・

  • SMILESを二次元に描画する

    以下のようなSMILESデータがあるのですが、これを 複数の構造を一度に見たいのですが、以下の9つの構造を一度に二次元に表示するフリーのソフトはあるのでしょうか。 CC(=O)OC1C2C(C(C(=O)O2)OC(=O)C)OC1=O CC(=O)NC(CCC(=O)N)C(=O)[O-] CC(=O)NC1=NN=C(S1)S(=O)(=O)N CC(=O)OCC[N+](C)(C)C CC(=O)NC(CS)C(=O)O CCC(C1=CC=CC=C1)C(=O)NC(=O)NC(=O)C CC(=O)NC1=CC=C(C=C1)O CC(=O)C1=CC=C(C=C1)S(=O)(=O)NC(=O)NC2CCCCC2 CCCC(=O)NC1=CC(=C(C=C1)OCC(CNC(C)C)O)C(=O)C

  • 官能基を逆に書くとき

    有機化合物などの官能基を左側に書くときに、 参考書を見ると、カルボキシル基はCOOHをHOOC、ヒドロキシ基はOHをHOと書いてあるのですが、 メチル基はCH3のまま書いてあるのですが、どうしてH3Cとはならないのですか?

  • 構造式と官能基

    ブドウ糖の化学式はC6H12O6ですよね?? では構造式はどうなるんでしょう?? ちなみに官能基も分かれば嬉しいです!! すいませんが、協力お願いします!!

  • ▲▲官能基のまとめ▲▲

    有機化学を学んでいる者です。 官能基のケトン基・エーテル基について質問です。 教科書などケトン基やエーテル基の表し方を、 R-CO-RやR-O-R、としていますが自分としては C-CO-CやC-O-Cとするのがいいと思います。 ケトン基やエーテル基はRの部分がCであるときに呼ばれるので Rでは《REST;残部》であるため、常に(炭化水素基である)とは 思えないのでR→Cとした方がいいと思った次第です。 しかし、どの教科書(マクマリーなど)を見ても明記されていません。 もっと大切な事があるとおもいますが、気になります。 よろしくお願いします。

  • この官能基の名前はなんでしょうか? CH3CHOH

      H H   || H-C-C-O-H              ||   H うまく表示されてるといいのですが… ↑の官能基の名前をご存知の方はいらっしゃいますか? 調べたのですが見つけることができませんでした。 また、官能基の名前が分からなかったりするときには何で調べればいいのでしょうか? 一応IUPACの置換基一覧で調べるのですが、乗ってないものも多くあまりみつかりません

  • 試薬を加えたときの官能基、化合物の変化

    どうしてもわからない問題があるので、わかる方がいたら教えてください。 次に示す官能基あるいは化合物にある試薬を加えると、ある変化が見られた。その試薬と変化を下から適当なものを選び答えよ。という問題なんですが… 選択肢は同じものを選んでもいいみたいです。 《官能基または化合物》 (1)アルコールの-OH基の存在 (2)-CHO基の存在 (3)フェノール性-OH基の存在 (4)RC=O    |    CH3 の存在 (5)アニリンの存在 (6)C=C結合の存在 (7)-SO3H基の存在 (8)-COOH基の存在 (9) H    |   RCCH3    |    OH の存在 《選択肢(試薬)》 a.金属ナトリウム b.ヨウ素-水酸化ナトリウム水溶液 c.さらし粉 d.臭素水 e.フェーリング溶液 f.酸化鉄(III)水溶液 g.炭酸水素ナトリウム水溶液 《選択肢(変化)》 ア.水素ガスが発生する。 イ.色が消える。 ウ.赤色沈殿が生成する。 エ.二酸化炭素(炭酸ガス)が発生する。 オ.紫色を呈する。 カ.黄色沈殿が生成する。 多くてすみません。お願いします。 あと、「-OH基の存在」などというのはその-OH基などが変化を起こすという意味でしょうか? そこからわからないのでまったく手が出ません;

  • 電気陰性度と官能基

    電気陰性度と官能基の極性(特にROH、RCOOH、R-C(=O)-OR')の関係について教えてください。 よろしくおねがいします。

  • スクレイピング

    http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=41774&loc=ec_rcs ここのサイトにある  Canonical SMILES: の CC1C(C(C(C(O1)OC2C(OC(C(C2O)O)OC3C(OC(C(C3O)O)O)CO)CO)O)O)NC4C=C(C(C(C4O)O)O)COを抜き出したいのですがどうすればいいでしょうか。できればプログラムをみて勉強したいのですがよろしくお願いいたします。