• ベストアンサー

スクレイピング

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=41774&loc=ec_rcs ここのサイトにある  Canonical SMILES: の CC1C(C(C(C(O1)OC2C(OC(C(C2O)O)OC3C(OC(C(C3O)O)O)CO)CO)O)O)NC4C=C(C(C(C4O)O)O)COを抜き出したいのですがどうすればいいでしょうか。できればプログラムをみて勉強したいのですがよろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#259269
noname#259269
回答No.1

少なくとも、具体的に利用するツールを書いておくべきかと思いますが。

shiroshi77
質問者

お礼

すみません。 なんにもわかっていなくて質問してしまいました。 また、下調べして質問させていただきます。

関連するQ&A

  • 再度特定のURLに接続出来なく困っております

    特定のURL具体的には’https://www.ncbi.nlm.nih.gov’(PubMed)に二三日前から突然接続出来なくなり、大変困っております。URLのアドレスの変更などを考え、2,3他の場所に行き接続を試みましたが、いずれの場所でも接続出来ました。他のURLには試みた限りにおいて、正常に接続出来ます。パソコンはNECのWindows8.1で、インターネットはInternet Explorer11(更新バージョン:11.0.41)で、NECおよびウイルスバスターに問い合わせて、検討しても改善しません。正常であった時への復元を試みましたが、改善しませんでした。 どうすれば良いのかご教授をお願い致します。 コメントで インターネットオプション→コンテンツ→オートコンプリートの設定→パスワードの管理で’https://www.ncbi.nlm.nih.gov’の項目を見たら2項目あり、これらを削除したら接続出来るようになりました。どこに問題があったから不明ですが、一応は解決出来たかもしれません。 と書きましたら次の朝には再び接続が出来なくなり、以前同様画面に 「このページは表示できません •Web アドレス http://www.ncbi.nlm.nih.gov が正しいか確かめてください。 •検索エンジンでそのページを探してください。 •数分待ってから、ページを最新の情報に更新してください。」 と表示されます。認証関係ではじかれているのかとも思いましたが、どうもそうではないようです。大変困っておりますので、どなたかお助け下さい。

  • Michel Aplasiaは聴覚以外に障害残る?

    Michel Aplasiaは聴覚障害以外に何か障害が残りますか? 調べているのですが、よくわかりません。 Michel Aplasiaについての英語版wikiなど↓ https://en.m.wikipedia.org/wiki/Michel_aplasia https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4949031/

  • 特定のURLに接続出来なく困っております

    特定のURL具体的には’https://www.ncbi.nlm.nih.gov’(PubMed)に二三日前から突然接続出来なくなり、大変困っております。URLのアドレスの変更などを考え、2,3他の場所に行き接続を試みましたが、いずれの場所でも接続出来ました。他のURLには試みた限りにおいて、正常に接続出来ます。パソコンはNECのWindows8.1で、インターネットはInternet Explorer11(更新バージョン:11.0.41)で、NECおよびウイルスバスターに問い合わせて、検討しても改善しません。正常であった時への復元を試みましたが、改善しませんでした。 どうすれば良いのかご教授をお願い致します。

  • この医学論文を読める方いらっしゃいませんか?

    この医学論文を読める方いらっしゃいませんか? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5597705/pdf/main.pdf 結論には「成人および臍帯血の血漿中の総セファゾリンおよび遊離セファゾリンを定量するための堅牢なLC-MS / MS法が開発され、検証された。」とありますが、 母体血漿中のセファゾリン定量法を作成したところまでは分かるのですが、その後は 「臍帯血中のセファゾリン濃度は母体血漿中のセファゾリン濃度とほぼ変わらないから、母体血漿中のセファゾリン濃度さえ分かれば臍帯血を調べる必要がない」という解釈で良いでしょうか? どなたかよろしくお願いします。

  • なぜゲノム解析は進まないのでしょうか

    7月12日のNHKのクローズアップ現代で、現在では、人間1人の全ゲノムの解析は数日の時間と70万円くらいの経費とがあれば完了すると言っていましたが、NCBIのサイトによると、2012年2月現在で、哺乳類では3種(ヒト、マウス、ラット)しか解析が完了してないそうです。 http://www.ncbi.nlm.nih.gov/genomes/static/gpstat.html 数日の時間と70万円くらいの経費で完了するのなら、研究対象として面白そうでかつヒトと余りゲノムサイズの違わないチンパンジー、ゴリラなど、解析が完了していてもよさそうな哺乳動物がたくさんいると思うのですが、なぜ哺乳動物で3種という僅かな種しか完了してないのでしょうか。

  • SMILESを二次元に描画する

    以下のようなSMILESデータがあるのですが、これを 複数の構造を一度に見たいのですが、以下の9つの構造を一度に二次元に表示するフリーのソフトはあるのでしょうか。 CC(=O)OC1C2C(C(C(=O)O2)OC(=O)C)OC1=O CC(=O)NC(CCC(=O)N)C(=O)[O-] CC(=O)NC1=NN=C(S1)S(=O)(=O)N CC(=O)OCC[N+](C)(C)C CC(=O)NC(CS)C(=O)O CCC(C1=CC=CC=C1)C(=O)NC(=O)NC(=O)C CC(=O)NC1=CC=C(C=C1)O CC(=O)C1=CC=C(C=C1)S(=O)(=O)NC(=O)NC2CCCCC2 CCCC(=O)NC1=CC(=C(C=C1)OCC(CNC(C)C)O)C(=O)C

  • 官能基の数を数える

    官能基の有無を調べるソフトにOpenBabelなどありますが、 特定の官能基の有無はわかるのですが、その数を指定することはできる のでしょうか。 たとえば[OH]が5つ存在するものをSMILESとうからとって来れるのでしょうか。 COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O 例えばこれらのデータから[OH]が2つ以上含む化合物は判別できますでしょうか。

  • SMILSと官能基

    COC1=C(C=CC(=C1)CC=C)O CC(=O)NC1=CC=C(C=C1)CC(=O)O CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)N C(C(C1C(=O)C(=C(O1)O)O)O)O CC(=O)OC1=CC=CC=C1C(=O)O CC(=O)NC1=NN=C(S1)S(=O)(=O)N C1=NC2=C(N1)C(=NC=N2)N C1=NC2=C(C(=N1)N)N=CN2C3C(C(C(O3)CO)O)O のようなSMILESで書かれたデータがあるのですがこれらの中に特定の官能基が含まれているかを判断することは可能なのでしょうか。 例えば CCOC1=CC2=C(C3=C(C=C(C=C3)N)N=C2C=C1)Nの中にカルボキシル基、アミノ基、フェノール、オキシム、メチル基などが含まれているかどうかを判断する方法は存在するのでしょうか。 また、そのようなフリーのソフトはあるのでしょうか。

  • お願いします

    次の条件を満たす四角錐O-ABCDを考える。 (I) 四角形ABCDは1辺の長さが1の正方形である。 (II) OA=OB=OC=OD=2 線分OB上の点Eを、線分の長さの和 AE+EC が最小になるようにとる。3点A,C,Eを通る平面と直線ODとの交点をFとおく。 (1) 四角錐O-ABCDの体積Vを求めよ。 (2) 線分OEとOFの長さを求めよ。 (3) 四角錐O-AECFの体積Vを求めよ。 (2)のOFの長さから分かりません。 どなたかお願いします(>_<)

  • core2quad などのpcで・・

    モニタなどがそろってて、7でもvistaでもなんでもいいので予算八万位で買えるところはないでしょうか? また、DELLさんの http://configure.apj.dell.com/dellstore/config.aspx?c=jp&cs=jpbsd1&l=ja&oc=2088O1402kakaku&s=bsd&dgc=LS&cid=21502&lid=1559072&acd=/Vv6e0WKODg-FdvxFow0X5zT8tZtPWTapw これは絶対法人様じゃないと買えないんですか? 適当な会社名を入れてかっても大丈夫ですかね?・・・ 今安くてそれなりにいいpcを探してます・・ ぜひ協力願います! すいません