• ベストアンサー

著作権とクローラー(スパイダー、ロボット)での情報収集

リンク集に類似したサイトを運営しております。 今後のサイト展開にあたって疑問点があり、質問させていただきます。 私の運営するリンク集は、個々のリンクについて「サイト名」「サイトのカテゴリ」「そのサイトへのリンク」を表示することで構成されております。現状では「リンク先サイトの説明文」は表示されないため、リンク集としての価値は薄いと考えております。 そこでクローラーを作成して、リンク先サイトのトップページから、「サイト説明文」(METAタグのDescriptionや本文)を取得して、それを表示させたく思っております。つまりは、Google や Yahoo 等の検索エンジンと似た結果を表示する形になります。 このようにリンク先サイトのトップページから、サイト説明文となるデータを取得(クロール)し、自分のサイトに表示することは、著作権の侵害に当たるのかを疑問に思っております。 なお、作成するクローラーは、「robots.txt」や「METAタグの Robots の値」を尊重して、クロールを望まないサイトに対するクロール行為を慎むつもりでおります。 参考までに下記ページには、「他人の作ったホームページを全部または一部ダウンロードすれば複製権の侵害に当たると考えます」と記述されておりました。 ●ホームぺージは著作権で保護されるのでしょうか。 http://www.cric.or.jp/qa/multimedia/multi12_qa.html どうかお知恵をお貸しくださいますようにお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • cdsdasds
  • ベストアンサー率52% (114/217)
回答No.1

話は2つあり、 1.先方の説明文を、あなたのサイトのコンテンツではなく、先方のサイトの説明として用意している。 2.先方の説明文を、先方のサイトの説明としてではなく、あなたのサイトのコンテンツとして受け取られる可能性のある形式で表示している(いわゆるディープリンク)。 1.の場合は、サイトの説明文程度では著作権法には触れません。 2.の場合には、サイトの説明文が著作物であれば著作権法違反とされる可能性があります。 過去に自社のニュースの見出しを新聞社のサイトからそのまま持ってきたことを新聞社が訴えたケースでは、新聞の見出し程度の文章では著作物としての保護は受けられないとの判例が出ています。 この判例では多大な労力をかけて編集したものの保護は必要だとしていますが、METAタグのDescription等ならこうした保護の対象にはならないでしょう。 ただ、本文についてはたいていの場合、著作物ということになりますから、本文のデープリンクをお考えなら著作権法に振れる可能性が高いということをご理解ください。

spidermen
質問者

お礼

ご回答ありがとうございます。とても参考になります。 > 1.先方の説明文を、あなたのサイトのコンテンツではなく、先方のサイトの説明として用意している。 私のサイトに載せる説明文は、先方のサイトの情報を表示しているものだという注記を入れるようにしたいと思います。 > ただ、本文についてはたいていの場合、著作物ということになりますから、本文のデープリンクをお考えなら著作権法に振れる可能性が高いということをご理解ください。 サイトによっては、METAタグのDescriptionが未設定である場合があり、そのケースにおいては、代わりにクロールした本文を表示させるということを考えております。 その際、Google や Yahoo といった検索エンジンのように表示する範囲を僅かに留める形(具体的には、最大100文字程度)にすれば、「他の検索エンジンもしている事ではないか」ということで、悪い言い方をすれば言い逃れができるのではないかと思いました。

その他の回答 (1)

  • nobrain
  • ベストアンサー率39% (29/73)
回答No.2

リスト・データベースは編集著作物となるそうです。 リンク集も同じに考えていいんじゃないかと思います。 (並べただけではダメなんでしょうけどね) 項目に入るタイトルやアドレスは、著作権がおよばない対象だと思います。 >他の検索エンジンもしている事ではないか 本文の利用は、「引用」でしか出来ません。 出典の明示は出来てますし、一部分の利用で、項目の補足をしていると考えるなら「引用」の要件は満たされているように思います。

spidermen
質問者

お礼

> 出典の明示は出来てますし、一部分の利用で、項目の補足をしていると考えるなら「引用」の要件は満たされているように思います。 ご回答ありがとうございます。 「引用」の域を超えない範囲で、データを扱えば問題なさそうですね。

関連するQ&A

  • クローラーについて教えて!

    1 クローラーにペナルティーと判断されたサイトは修正して再度クローラー登録をすればペナルティーなしになるのでしょうか。 2 この記述はクローラーに対し有利であり必要ですか。 <META name="ROBOTS" content="INDEX,FOLLOW"> 宜しく願います。

    • 締切済み
    • SEO
  • ロボット巡回対策のMetaタグに関する質問です。

    ロボット巡回対策のMetaタグに関する次のサイトについて質問です。 http://heo.jp/tag/page/key.html ■ ロボット巡回対策 <Meta Name="ROBOTS" Content=""> <Meta Name="ROBOTS" Content="INDEX,FOLLOW"> INDEX,FOLLOW・・・・このページもページからのリンク先も許可。 <Meta Name="ROBOTS" Content="INDEX"> INDEX・・・・このページのみ巡回許可。 <Meta Name="ROBOTS" Content="NONE"> NONE・・・・このページもそこにあるリンク先全てを巡回禁止。 <Meta Name="ROBOTS" Content="NOINDEX"> NOINDEX・・・・このページのみ巡回禁止。 <Meta Name="ROBOTS" Content="NOFOLLOW"> NOFOLLOW・・・・このページは巡回許可、リンク先巡回禁止。 <Meta Name="ROBOTS" Content="ALL"> ALL・・・・下の階層の巡回を許可。 ------------------------------ ★★質問★★ 自分のサイト内を全て巡回禁止にしようと思います。最も簡単な方法を取りたいのですが、上の説明から類推すると、 <Meta Name="ROBOTS" Content="NONE"> NONE・・・・このページもそこにあるリンク先全てを巡回禁止。 これでよさそうですが、ここで言う「リンク先全て」とは、「下の階層全て」と考えていいのでしょうか。それとも文字通り他のサイトであろうとなかろうとリンク先全てということでしょうか。 それとも別に適切な記述がありますか。 ★★希望 そのサイト内のページをホームページ「...index.html」に巡回禁止の記述をすれば完璧にすべて巡回禁止になるようにしたいのです。 よろしくお願いします。

    • ベストアンサー
    • HTML
  • ロボット検索による自動収集に関して

    サイトを運営して間もないのですが、検索にはトップでヒットしたりしているようです。 しかし、意図としないかんじでヒットしているようです。 そこで少しでもと思い、少し調べると「ロボット検索による自動収集させない方法(タグ)」があることを知りました。 もちろん、完全にそうなるとは思っていません。 少しでもと思っているだけです。 でも、タグに関しては一切知識はありません。 http://www.tagindex.com/html_tag/page/meta_03.html ↑こちらを見ての疑問なのですが、 1:どこに組み込めばいいものなのか? 以下が、運営しているサイトの一部です。 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <HTML> <HEAD> <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> <META name="GENERATOR" content="IBM WebSphere Studio Homepage Builder Version 8.0.0.0 for Windows"> <META http-equiv="Content-Style-Type" content="text/css"> <TITLE>***</TITLE> </HEAD> <BODY link="#ff0000" vlink="#0000ff" alink="#cc00cc"> ↑これのどこを変更すればいいのでしょうか? 「META」に関して、3つあるのですが・・・。 2:貼り付けたURLにある、「リンク先ページの収集を許可しない指定」ですが、 今のリンクは、「A⇔B⇔C⇔D→Aに戻る」にしています。 (AからC以降飛ぶように設定していません) もし、Bに「リンク先ページの収集を許可しない指定」のタグを組み込めば、Aも収集されないということになるのですか? (Aだけは収集するようにし、B以降は収集させないようにしたいのです) この場合は、各ページに「リンク先収集」ではなく、そのページの収集を許可しない指定をタグに組み込んだほうがいいのでしょうか? 宜しくお願いします。

  • ロボット検索にかからないようにするには?

    HPを作ろうと思うのですが 個人的なページで、内輪だけで楽しみたいページにしたいと思っています。 ですが、聞くところによると勝手にロボットが検索しに来るとか。 それで、それを避けるには <head>~</head>間に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> というようなタグを入れる方法があるというところまでは分かったのですが このタグは、ページごとに全部入れないといけないのでしょうか?

  • metaタグについて

    初歩的な質問ですが下のタグはサイトの全ページをクロールしてくれますか? <meta name="robots" content="noarchive">

    • ベストアンサー
    • HTML
  • クローラの可能性

    クローラプログラムについて質問です。 クローラを使用して、パスワード等の認証機能のかかったHPサイトの リンク先にあるページから文章等の情報をを取得することは可能なのでしょうか? 勿論、パスワード等は事前にわかっている場合です。 また、クローラはイントラでも情報取得することは可能なのでしょうか? 知識が無いので、当たり前の事を聞いていた場合申し訳ありません。

  • ロボット検索のnofollowについて

    よろしくおねがいします。 検索されたくないので <META NAME="Robots" CONTENT="noindex, nofollow"> というタグ?を入れようと思っています。 HTMLの内容は (1) 自分の趣味などのこと(私は薔薇が好きです) (2) 上記のイメージを別ページで開く為のリンク(薔薇のgif600×600) (3) 花屋さんのリンク(薔薇を買ったのはこのお店です。) このような場合、 <META NAME="Robots" CONTENT="noindex, nofollow"> を入れてしまうと、 (3)にも影響が出てしまうのでしょうか? (1)(2)は自分で作成したものなので検索されたくありません。 (3)は検索された方が良いです。 記述例として、 CONTENT="noindex, nofollow" … そのページとリンク先ページの収集を許可しない とありました。 http://www.tagindex.com/html_tag/page/meta_03.html (3)が複数あった場合、などどうしたら良いのか悩みます。 よろしくお願いします。

    • ベストアンサー
    • HTML
  • Yahoo 検索避け 検索結果の表示

    お世話になります。 お時間あるときにでも助言いただけますと助かります。 1年ほど運営しているサイトがあります。 検索避けを行っていますが、1週間ほど前よりyahoo検索に引っかかるようになりました。 調べたところyahooのキャッシュ削除は難しいようですので .htaccessなどで対策をとろうと思っています。 疑問なのは、yahoo検索結果の表示についてです。 検索結果の多くは、  タイトルリンク  ページ内テキスト一部  URL ブックマーク キャッシュリンク という表示構成のようですが、自サイトの検索結果の表示は  タイトルリンク  URL のみの表示となっています。 以上について、次の4点を伺います。 1).これはキャッシュとは異なるものでしょうか? 2).異なるのであれば具体的にどのようなシステムで検索結果に表示されるのでしょうか? 3).METAタグや.htaccessでの対策は的外れなものでしょうか? 4).的外れであれば、METAタグや.htaccess以外の効果的な検索避け対策があればご教示いただきたいです。 1点でもご存知のものがあれば情報頂けますとうれしいです。 よろしくお願いいたします。 -------------------------------------------------- ◇参考までに◇  現在の検索避け対策は、下記METAタグ記載(サイト内全ページ)のみです。 <meta name="robots" content="none"> <meta name="robots" content="noindex,nofollow"> <meta name="robots" content="noimageindex"> <meta name="robots" content="noimageclick"> <meta name="robots" content="noarchive">

  • クローラーについて

    私の名前をグーグルやヤフーに入れて検索すると、関係した記事が出てきます。 しかし、どれも嫌な文章ばかりで、名前を入れても出てこないようにすることはできないでしょうか? 何でもクローラーという巡回機能が関係していると言うことですが、説明文を読んでも良く分かりません。 【robots.txtで登録拒否をするには】 robots.txtを置いて登録を拒否する方法は以下のとおりです。 ・サイトで公開されているすべてのページをモバイル版Yahoo!検索の[サイト検索]の検索対象から除外する場合 下記のテキストを「robots.txt」という名前で保存し、サイトのあるウェブサーバーのトップレベルに置きます。 ファイルの中身(Y!J-SRD/1.0を拒否する場合の例) User-agent: Y!J-SRD/1.0 Disallow: / ・モバイル版Yahoo!検索を含む、すべての検索エンジンから除外する場合 下記のテキストを「robots.txt」という名前で保存し、サイトのあるウェブサーバーのトップレベルに置きます。 ファイルの中身 User-agent: * Disallow: / これ一体どこにどう貼り付けろと言うのですか? とにかく (1)今までに特定の投稿された文章を、検索されても表示できないようにしたい。 (2)私の名前を検索されても、今後一切関連した文章が表示されないようにした。 以上の2点、どなたか分かりやすくご説明して頂けませんか? 誹謗中傷ばかりで困っています。

  • 検索エンジン用METAタグについて

    http://www.juraihelm.com/NNR/ (1)<META NAME="ROBOTS" CONTENT="NONE"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> そのページと、そこからリンクしている全てのページを制限する。 (2)<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> そのページのみを許可し、そこからのリンクを制限する。 index.htmlに使うと便利。 (3)<META NAME="ROBOTS" CONTENT="INDEX"> そのページの登録を許可する (4)<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> そのページを制限し、そこからのリンクを許可する。 このような使い方は普通しない。 (5)<META NAME="ROBOTS" CONTENT="ALL"> 下の階層ページの巡回を許可する。 このような設定は、わざわざすることでもない。 ---------------------------------------- 上は検索エンジン用METAタグの説明サイトです。 今回、ホームページの一部をアップロードします。同様のファイルが並列的に同じフォルダーの中に約40個あります。相互にリンク設定もあります。 この場合、放置すると、それぞれ個別に検索ロボットが拾い上げ、ヒット効率が著しく低下します。これらのうち、一つのページだけ検索エンジンに掲載され、他は載らないようにMETAタグを設定したいのです。 ■(4)のタグを設定しようと思いますが、これでいいのでしょうか。「このような使い方は普通しない。」という記載が気になります。 ■「そこからのリンクを制限する」とは、リンクしたページの拾い上げもしないということでしょうか。 教えてください。