- ベストアンサー
URLからドメイン名の抽出する
URLからドメイン名を抽出するよいライブラリはないでしょうか? (例) http://www.domain.co.jp/~username/dafult.htm ↓ domain.co.jp 正規表現で簡単に出来そうですが、 .jp .co.jp .co.uk .com.uk 等、一筋縄ではいかないようです。 どうかよろしくお願い致します。
- yn001ster
- お礼率66% (144/218)
- Perl
- 回答数5
- ありがとう数3
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
Operaブラウザでは、 jpをDNSでひく ⇒ IPアドレスなし co.jpをDNSでひく ⇒ IPアドレスなし domain.co.jpをDNSでひく ⇒ IPアドレス有り みたいな方式で、ドメイン(domain.co.jp)を抽出しているようです。 IEやFirefoxでは、もっとテキトーな方法らしいです。ですので、 Set-Cookie: a=b; domain=com.uk のようなcookieをブラウザが食べてしまう問題があります(cookie monsterと呼ばれる問題)。 >一筋縄ではいかないようです。 その通りです。 Opera方式でも完全ではないようです。 恐らく現時点では、まともな方法やライブラリは存在しないのだと思います。 #役に立たない情報でスミマセン。単なる参考情報ということで。。。
その他の回答 (4)
- Tacosan
- ベストアンサー率23% (3656/15482)
裏技1: 「.」は必ずドメイン名である (ルートドメインだから無意味だけど). 裏技2: DNS的にはドメイン名しかない (ホスト名もドメイン名の一種) とか聞いたことがあるので, ホスト名を返してしまう. まあ, いずれにしても「ドメイン名」が何を意味するのかがわからないとなんともならないんですが. ところで http://www.a.example.co.jp/test/ という URL に対して www.a.example.co.jp, a.example.co.jp, example.co.jp の 3つに対して IPアドレスがあり, その他にはない場合どれを「ドメイン名」にします?
お礼
今回は、あくまで http://www.value-domain.com/regdom.php のようなサイトで、取得可能なものをドメインとしています。 学術的な定義はあまり意味がありません。
補足
みなさん、ありがとうございます。 簡易的に辞書を用いて対応しようと思います。 ありがとうございました。
- venzou
- ベストアンサー率71% (311/435)
#1です。 質問をよく読んでいませんでした、ごめんなさい。(^^; ドメインの部分のみですね。それは確かに難しいですね。
お礼
はい。 そうなんです。 ありがとうございます。 みんなが必要としそうなので、 「必要なものはすでに発明されている」 という思想の元、情報を探しているのですが、 なかなかないのかもしれませんね。 ありがとうございます。
- moon_night
- ベストアンサー率32% (598/1831)
(@url) = split("\/",$url); print $url[2];
- venzou
- ベストアンサー率71% (311/435)
$url = 'http://www.domain.co.jp/~username/dafult.htm'; if($url =~ m|//(.+?)/|){ print $1; } これでどうでしょう。
関連するQ&A
- ドメイン部分だけを抽出
URLからドメイン部分だけ抽出する作業があります。 ですが、URL自体が数千個あるため、エクセルの数式で効率よくやりたいです。 http://〇〇.com/ http://〇〇.com/〇〇/ http://〇〇.〇〇.com/〇〇/ というように、A列のセルに一つずつURLが記入されています。 このURLから、「〇〇.com」だけを抽出したものを、 B列に表示するようにしたいです。 そして、「〇〇」のドメイン名だけをC列に表示。 「.com」の部分をD列に表示したいです。 エクセル2016です。 よろしくお願いいたします。
- ベストアンサー
- Excel(エクセル)
- 正規表現でURLを抽出するには。
正規表現でURLを抽出するには。 HTML内リンク先などのURLを正規表現で抽出したいのですが。 HTML内で表記されているURLはhttpやhttps以外にも相対URLなど様々な書き方が できるようですが、それらを抽出する正規表現パターンはどの様に書けばよいのでしょうか?
- ベストアンサー
- Perl
- 正規表現でのURLの抽出方法について
下記のような、ドメインとURLの最後の部分(/dataの部分) が一緒で、途中の表記が違うURLがあったとします。 http://hogehoge.com/aaa/data http://hogehoge.com/aaa/bbb/data http://hogehoge.com/ddd/eee/data このようなURLを正規表現を使って抽出するには、どのように記述したらいいしょうか。
- ベストアンサー
- その他(プログラミング・開発)
- ファイルからjpgファイルのURLを抽出したい
外部のxmlを読み込んで、その中に記述されているJPGファイルのURLを抽出したいと思います。 読み込みは $line=file("http://xxx.hhhh.abc.com/?xml"); で可能だと思います。 JPGファイル名は、先頭がA~Zの1文字 + 数字の7文字 となっています。 例:P4139135.jpg 抽出したいのは 例:http://xxx.hhhh.abc.com/P4139135.jpgの部分です。 読み込んだファイルをループで回しながら、正規表現で検索するのだと思うのですが、その辺のソースが全くわかりません。
- ベストアンサー
- PHP
- 一つの行にURLが複数ある場合の、URL抽出方法は?
htmファイルの中から、リンクされたURL情報を抽出するのが今回の目的です。 ご相談したいのは、URL情報が一つの行中に複数ある場合の抽出方法です。 ちなみに「一つの行にある<a href>リンクが一つだけ」の場合ですと、正規表現 <a +href=('|\").*('|\") *> でURLデータを正しく抽出できるところまで来ています。 ですが一つの行にある<a href>リンクが2つ以上あった場合は、最長一致のルールに従って、うまく抽出できません。 具体的に申し上げると、 ケース1:<a href="www.hoge.htm">ほげ</a> <a href="www.hoge.htm"> が抽出できる。 ケース2:<a href="www.hoge.htm">ほげ</a><a href="www.hogehoge.htm">ほげほげ</a> <a href="www.hoge.htm">ほげ</a><a href="www.hogehoge.htm"> が抽出される。(本当は2つを別々に取り出したい)
- ベストアンサー
- その他(プログラミング・開発)
- ドメインの意味について教えて下さい。
ドメインをもう1つ取得したいと思っているのですが、 タイトル通り、ドメインの意味が分かりません。 以下のドメインでどれにしようか迷っているので、 意味の(国も)分かる方、ご教授いただければ幸いです。 .com .net .org .biz .info .co.uk .org.uk .me.uk .name .tk よろしくお願いします。
- ベストアンサー
- レンタルサーバ・ASP
- ドメイン名って?
超初歩の質問なのですが、URLのwww.xxxxx.comのxxxxx.comというのをドメイン名って言いますよね。 これって、LAN上のADSのドメインとかとは、違うんですよね。普通のWEBサーバってWindowsだったら、ADSとか無くても、IISとかが入っていたらWEBサーバになれますよね。このドメイン名というのは、LAN上のDCのドメイン名とは全然違うものなんですか? LAN上ならWEBサーバに、httpでIPかFQDNのコンピュータ名で、アクセスできますよね。そうしたら、URLのwww.xxxxx.comっていう名前は、どこのコンピュータが、そのWEBサーバのIPに割り当ててくれるんですか? 多分、国際規格があって、IPを割り当てるまでに、階層になっているとは思うんですが・・ こういうのって、インターネットの基礎の基礎ですよね。こんな質問してすみません。でも、ちょっと不思議なんです。教えていただけるととってもうれしいです。
- ベストアンサー
- その他(インターネット・Webサービス)
- <a href>タグ内のURL抽出
正規表現初心者です。ご教授よろしくお願いします。 <a href=http://hoge.com/hoge>hoge</a> <a href=http://hoge.com/hoge>hoge<br>hoge</a> 以上の<a href>リンクから、それぞれURLだけを抽出したいのですが うまくできません。 ereg("<a href=(.+)>(.+)</a>",$hoge,$a); echo $a[1]; で、1つ目はURL抽出できたのですが 2つ目のように<br>があると『 http://hoge.com>hoge 』と表示されてしまいます。 このような場合、どのようにして抽出すればよいのでしょうか??
- ベストアンサー
- PHP
- 文章が記入されているセルから、URLを抽出
文章の中にURLが記入されているセルがあります。 そのセルから、URLだけを抽出したいです。 URLは、httpsから始まるものだったり、 www.から始まるもの、ドメイン名だけのものなど様々です。 セルからURLを抽出するには、どのような記述でできるでしょうか? よろしくお願いいたします。
- 締切済み
- Excel(エクセル)
- ドメインの設定について
初心者です。 ドメインの設定について質問します。 ネットで一から調べていましたが、 各用語の役割等はわかっても結局、解決できません。具体的に質問させてください。 ------------------- 現在有料プロバイダのホームページのサーバーに ホームページを立ち上げています。 それには独自ドメインを取得して設定してあります。 【例1】www.XXXXX.abc.co.jp(←独自ドメイン) ところで、まったく別目的のホームページを作ることになり、 同じサーバー内にフォルダを一個作って、その中に 新しく作るホームページのトップページを作ろうと考えました。 【例2】www.XXXXX.abc.co.jp/betsu/index.htm (上記【例1】に階層が1つ増えた) で、このURLでは格好つかないので、 [例2]のホムペ用にネットで見つけた別のドメイン会社で 新しく別のドメインを取得しました。 【例3】www.zzzzz.efg.com それで、[例3]のドメインの管理画面に、 プロバイダのネームサーバを入れてみましたが、 www.zzzzz.efg.comには表示されません。 というより、[例2]のwww.XXXXX.abc.co.co.jp/betsunoHP/index.htm の情報を 管理画面のどこにも入れていないので、 僕自身、勘違いしていると思っています。 恐縮ですが、急を要しております。 ご存知のかた、ぜひご教授ください。 よろしくお願いします。
- 締切済み
- その他(インターネット接続・通信)
お礼
ありがとうございます。 とても参考になりました。 やはりDNSを引くか、辞書を用意するしかないのですかね。 ありがとうございます。