- ベストアンサー
教えてGOOの内容をすべて、テキストデータに
教えてGOOの内容を、すべて、テキストデータに変換できれば、使いやすいのですが、容量的に無理なのでしょうか? たとえば、一件の容量を400字詰め原稿用紙、2枚として、だいたい2KBとして計算すると、現時点での件数は737636なので、1.40692901611328125GBになります。CD-Rは無理ですが、DVD-Rには、収まると思うのですが、無理なんでしょうか? パソコンのメーカーサポートで、すべてのQ&Aがテキストファイルになっているメーカーというのはあるのでしょうか?
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
> 1.40…GBになります。 で、そのデータをダウンロードするわけですが、 No.316126 質問:教えてGOOの現在の会員数は? http://oshiete1.goo.ne.jp/kotaeru.php3?q=316126 | 108000以上のユーザデータは存在するようです。 会員数を12万、そのうちの1%の人が同じようにダウンロードしたいとした場合、 1200×1.4GB=1680GB ものデータが回線を流れ、その間教えて!gooのサービスにも支障をきたす事が予想されます。 しかも、ダウンロードしたデータのうち、実際役に立つのはほんの一部でしょうから、限られた回線を長時間無駄に占有する事になります。 質問者さんにとっては役に立つかも知れませんが、他の人には迷惑になるだけではないでしょうか? 必要がある時に↑の[検索]で検索する、キーワードが思いつかなければ、それこそ質問するなどすれば、十分役に立つのではないでしょうか? 後は著作権的な問題とか、 「教えて!gooサービス」利用規約 http://oshiete.goo.ne.jp/ask/guide03.html | 第13条(情報の無断使用の禁止) とか。 -- ただ、一般的には、以下のようなwebページのダウンロード用ソフトを利用するのでは? トップ>フリーソフト&シェアウェア>Windows>インターネット&通信>Web用>ダウンロード http://computers.yahoo.co.jp/download/vector/win/net/www/download/ -- > パソコンのメーカーサポートで、すべてのQ&Aがテキストファイルになっているメーカーというのはあるのでしょうか? Q&Aの件数自体が少ない所ですと、一括で取得できたりもしますが…。 通常、こういったサイトはデータベースとして情報を保持します。 データベースを管理している人ならば、全部のQ&Aをテキストに出力、DVDにバックアップなどの作業は可能なはずですが。
その他の回答 (2)
- osamuy
- ベストアンサー率42% (1231/2878)
No.10のn乗(n=0..5)の質問をcurlでgetしてきて、本文(余分なヘッダ部とフッタ部を除いたもの)バイト数と、回答数の集計してみました: No.1= 15278バイト、回答数7 No.10= 25691バイト、回答数13 No.100= 5189バイト、回答数2 No.1000= 4699バイト、回答数2 No.10000= 10574バイト、回答数3 No.100000= 24856バイト、回答数5 これでいくと、1件14KBでトータル10GBくらいになります。 圧縮すると、1/4くらいにはなりそうですが。 ただ、回答は動的に増えていきますから、ローカルに落としたものに求める回答が無い事もありますし、それ以前にスタージョンの法則が適用されている可能性大。
お礼
スタージョンの法則? 初めて聞きました。 回答。ありがとうございました。
- UKY
- ベストアンサー率50% (604/1207)
質問者さんのお考えになっていることがいまいちよくわからないんですが、このサイトの内容のすべてを1枚のディスクに収録したものを作って売ってくれとかそういうことですか? テキストデータにすればどう便利なのか私には理解できません。どうせ何十万もある質問を100%全部読むことなんてできないんだから、読みたいものだけWebから直接閲覧するという今のやり方が最も合理的ではありませんか? > パソコンのメーカーサポートで、すべてのQ&Aがテキストファイルになっているメーカーというのはあるのでしょうか? 各種ソフトに付属している「ヘルプ」は大体テキストベースですが、そういうことじゃないんですよね?
お礼
webと比べて、テキストデータが便利なのは、検索が早いからです、webは題名で探しますが、テキストデータの場合は、本文で検索ができるので、ここのところに最大の特徴があると思いました。 教えてGOOの内容をDVDにして売ってくれというわけではなく、ただ、あれば便利だと思いました。確かにデータ的に考えると、DVDにデータを焼き込んで配るという方法しかないと思いますが。
お礼
ありがとうございました。この質問をしたのは、同じような質問をよく見かけるので、自分もしてしまうので、それを防ぐためにはどうすればいいかと思い、質問をしました。 すべての回答がテキストデータになっていれば、検索もしやすいですし、同じ質問をしなくてもいいと思ったのですが、どうやら無理そうですね