- ベストアンサー
URLを抽出する正規表現
<h3 class="r"><a href="/url?q=http://aaa.co.jp/index.html&sa=U&ei=CuI5T_2iLO7ymAWt6tGlCw&ved=0CBoQFjAB&usg=AFQjCNHEkBnpOAp3vxF9loM0Vk_AuM2e3Q"> 上記のものから http://aaa.co.jp/index.html のみ抽出する正規表現を教えてください。 よろしくお願いします。
- jack111
- お礼率33% (1/3)
- PHP
- 回答数3
- ありがとう数3
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
ちょっと修正 <?PHP $str=<<<eod <h3 class="r"><a href="/url?q=http%3A%2F%2Faaa.co.jp%2Findex.html&sa=U"> eod; $pattern="/<h3 class=\"r\"><a href=\"\/url\?q=(.*?)(?:&|\")/"; preg_match($pattern,$str,$match); print htmlspecialchars($match[1]); ?> こうしてしまうと、h3タグとaタグの間にスペースや改行が入ると マッチしませんがよいですね? また、パラメータqは一つ目ででてこないとマッチしませんがよいですね?
その他の回答 (2)
- yambejp
- ベストアンサー率51% (3827/7415)
ああ、なんとなくわかった こういうことですね? コロンやスラッシュもエンコードしたほうがよいですね <?PHP $str=<<<eod <h3 class="r"><a href="/url?q=http%3A%2F%2Faaa.co.jp%2Findex.html&sa=U&ei=CuI5T_2iLO7ymAWt6tGlCw&ved=0CBoQFjAB&usg=AFQjCNHEkBnpOAp3vxF9loM0Vk_AuM2e3Q"> eod; $pattern="/(?:\?|&)q=(.*?)(?:&|$)/"; preg_match($pattern,$str,$match); print htmlspecialchars($match[1]); ?>
補足
ご回答ありがとうございます。 適切なお答えありがとうございます。 ですが、大変恐縮で申し訳ないのですが、 <h3 class="r"><a href="/url?q= という一定のタグの後のURLの場合はどうなるのでしょうか。 よろしくお願いします
- yambejp
- ベストアンサー率51% (3827/7415)
index.html?・・・ じゃなくて?
関連するQ&A
- このメモリは
このメモリは https://www.google.co.jp/url?sa=t&source=web&cd=1&ved=0CDAQFjAA&url=http%3A%2F%2Fs.kakaku.com%2Fitem%2FK0000403227%2F&ei=82uwUIjVAeiJmwWugoCYCw&usg=AFQjCNG2yhBPAMEWH8y_JmrfgOkrXp_xLw このパソコンで使えますか? https://www.google.co.jp/shopping/product/11994934852624272249?q=e1-531%20e1-531-h82c&ie=UTF-8&oe=UTF-8&hl=ja&client=safari&sa=X&ei=e2ywUMaOLuLRmAWr8YDABg&ved=0CDoQ8wIwAg
- 締切済み
- その他(PCパーツ・周辺機器)
- グーグルの表示の仕方
どうぞよろしくお願いいたします。 グーグルで「ブートキャンプ」と検索すると 上位でなんと画像「サムネイル」がでてきます。 ユーチューブにリンクしているんですが、これは どうしたら画像を乗せることができるのでしょうか? ここだとわかるかたはおられませんでしょうか? どうぞよろしくお願いいたします。 わかる範囲でタグを調べたんですが <DIV class=g><A href="http://www.google.co.jp/url?q=http://www.youtube.com/v/gfiUcwL2H24&sa=X&oi=video_result&resnum=4&ct=thumbnail&usg=AFQjCNH1UF6MqXDaBJtq8GkoS59d44ysZQ"><IMG height="75" alt="" src="2.jpg" width="100" border="1"></A></DIV>(画像のアドレスは取り込んでいます)
- ベストアンサー
- その他([技術者向] コンピューター)
- スプレッドシートでの検索結果のURL取得について
スプレッドシートを使い、Google検索結果のURLをスクレイピングしたいと思っています。 いろいろなサイトで紹介されている方法を試してみましたが、取得できたURLの前後に余分な文字列が含まれており、これを除いて純粋にURLの文字列だけを取得することは不可能なのでしょうか? 私がやった方法は以下のような感じです。 A1セルに「パソコン」と入力 A2セルに=IMPORTXML("http://www.google.co.jp/search?hl=jp&gl=JP&q="&A1,"//div[@id='res']//h3[@class='r']/a/@href")と入力 結果は以下のとおりです こういったものが10サイト分(検索結果1ページ分)表示されます /url?q=https://www.biccamera.com/bc/c/pc/intel/index.jsp&sa=U&ved=0ahUKEwjBvvX0ia3dAhWuxVkKHcVcB4MQFgghMAI&usg=AOvVaw185ZVa-oN20szNKSbDcXJv
- ベストアンサー
- その他(プログラミング・開発)
- ヨガの正しいポーズ
どれが正しいツルのポーズですか? http://allabout.co.jp/gm/gc/8138/ http://www.google.co.jp/url?sa=t&rct=j&q=%E3%83%A8%E3%82%AC%20%E3%83%84%E3%83%AB&source=web&cd=2&ved=0CFUQtwIwAQ&url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DbgRW1p7HDx0&ei=kGLMT-n3COzTmAXB9o2ZDw&usg=AFQjCNEjOtN6-gBHbQvPweUo1dosfCMoAw&cad=rja http://www.google.co.jp/url?sa=t&rct=j&q=%E3%83%A8%E3%82%AC%20%E3%83%84%E3%83%AB&source=web&cd=3&ved=0CFwQFjAC&url=http%3A%2F%2Fnambamiracle.blog28.fc2.com%2Fblog-entry-148.html&ei=kGLMT-n3COzTmAXB9o2ZDw&usg=AFQjCNGiZyYyMGmr0FBUCDNlDpJjZ6LHmQ&cad=rja
- ベストアンサー
- その他(ダイエット・フィットネス)
- PILOT(ペンの会社)の総合カタログ入手
ペンのを集めるのが趣味としているものですが、 パイロットのカタログは、どこで入手するのでしょうか? そしてそれは有料なのでしょうか? 方法を教えていただければ幸いです。 これが、カタログです http://www.google.co.jp/url?sa=t&source=web&cd=4&ved=0CDsQFjAD&url=http%3A%2F%2Fwww.pilot.co.jp%2Fcatalog%2Fsougou2010%2Fdigibook%2Fdigibook.html&ei=1fxHTaHzPJGAvgPsl5GABg&usg=AFQjCNHiTxH5I02KK4mCGkcECa-gvVOL7A
- ベストアンサー
- その他(趣味・娯楽・エンターテイメント)
- googleのURLから自サイトへの参照された経路
お世話になっております。 自分で制作したホームページがあり、FC2にてアクセス解析を行っています。 リンク元はgoogleからのようですが、当該URLをブラウザのアドレス欄に 入力しても、すぐに自サイトへ飛ばされてしまいます。 その為、googleからどのような経路で自サイトへ参照されたかが分かりません。 googleからどのような手順、もしその検索キーワードがあれば、 そのキーワードが知りたいです。下記2件が当該URLです。(FC2を介して表示されます) もしその解析方法が分かれば、その方法もご教示頂ければ幸いです。 何卒宜しくお願い致します。 http://analysis.fc2.com/redirect.php?r=http%3A%2F%2Fwww.google.co.jp%2Furl%3Fsa%3Dt%26rct%3Dj%26q%3D%26esrc%3Ds%26source%3Dweb%26cd%3D16%26ved%3D0CEgQFjAFOAo%26url%3Dhttp%253A%252F%252Fwww7b.biglobe.ne.jp%252F~w8g7i%252Fmado_orico%252Findex.htm%26ei%3DxgV3VK-cJIXGmQWo44L4Dg%26usg%3DAFQjCNHs5VRNSt5kO01A60puoNF7ieiFIw%26sig2%3D7ljvMNbg3bQW-gX-_4mxNg%26bvm%3Dbv.80642063%2Cd.dGY&lang=ja http://analysis.fc2.com/redirect.php?r=http%3A%2F%2Fwww.google.co.jp%2Furl%3Fsa%3Dt%26rct%3Dj%26q%3D%26esrc%3Ds%26source%3Dweb%26cd%3D18%26ved%3D0CEoQFjAHOAo%26url%3Dhttp%253A%252F%252Fwww7b.biglobe.ne.jp%252F~w8g7i%252Ffile-manage%252Findex.htm%26ei%3DSkB3VK2SMqTQmwX37IDIDQ%26usg%3DAFQjCNHYzlJN5Z_jlBNbbmGYDXr8cCRoOA%26bvm%3Dbv.80642063%2Cd.dGc&lang=ja
- 締切済み
- その他(インターネット・Webサービス)
- 正規表現でURLを抽出するには。
正規表現でURLを抽出するには。 HTML内リンク先などのURLを正規表現で抽出したいのですが。 HTML内で表記されているURLはhttpやhttps以外にも相対URLなど様々な書き方が できるようですが、それらを抽出する正規表現パターンはどの様に書けばよいのでしょうか?
- ベストアンサー
- Perl
- 正規表現でURLを抽出したいと思っています。
お世話になります。 SPAMメール対策のため、フィルタ用のURLリストを作りたいと思っています。 秀丸にエクスポートした多数のSPAMメールの本文内から「http」で始まるURLを抜き出し、置換したいと思うのですがうまくいきません。 ^[^(http)].*$ で置換すればよいのかと思いましたが 文字列の否定はできないようです。 お知恵を貸して頂けると幸いです。 宜しくお願い致します。
- ベストアンサー
- その他(プログラミング・開発)
- ブリグリについて質問です
ウィキペディアhttp://www.google.co.jp/url?sa=t&rct=j&q=thebrilliantgreen&source=web&cd=2&ved=0CC8QFjAB&url=http%3A%2F%2Fja.wikipedia.org%2Fwiki%2FThe_brilliant_green&ei=wks_T5GnDIWRiQeUm-npBA&usg=AFQjCNFbETZAJrzeEUE1pvAo35Ti_BqvrQに、 >YUI・大塚愛など、このバンドでの川瀬の声のフォロワーもいる。 とありますが、どういう意味ですか? twitterはYUIはしていないと知っているので、Twitterでのフォロワーという意味ではないとは分かるのですが。。。
- ベストアンサー
- 国内アーティスト
- googleの検索メニューのCSSが知りたい
googleの検索結果の左カラムのメニューに、すべて、画像、動画、ニュース…などといったボタンがありますよね。 http://www.google.com/search?q=htmlの左側にある、カーソルを載せると灰色の背景になるものです。 ・onmouseoverで背景が四角く灰色になる。 ・画像でなくテキストで、背景の色を切り替えている このデザインが気に入ったので全く同じものを作ってみようと思ったのですが、どうもうまくできません。 ソースコードを見ても、 <div id="leftnav" role="navigation" style="position: absolute; top: 1px; width: 175px;" onclick="google.srp&&google.srp.qs(event)"><div id="ms"><ul> <li class="mitem"> <a href="/search?q=html" class="kl"> <span class="micon" style="background-position: -40px -132px;"></span>画像 </a> </li> : : </ul> <a href="#" id="showmodes" class="jsb nj kl" onclick="google.x(this.id,function(){ google.srp.toggleModes()} );google.log('', '\x26ved\x3d0CBMQ_gU' +'&ei=' + google.kEI);return false" style="padding-left: 16px;"> <span class="micon"></span> <span class="msm">もっと見る</span> <span class="msl">隠す</span> </a> </div> <div class="lnsep"> </div> と書かれており、私の現在の能力では理解できません。 どなたかこれと同じようなメニューを表示することができるコードのお手本を教えてもらえませんか。 どうかよろしくお願いします。
- ベストアンサー
- CSS
お礼
迅速な対応ありがとうございます。 バッチリ取得できました。 今後は、しっかりと正規表現を勉強していきます。