• 締切済み

生データの基準

統計の課題で、「生データを用いてヒストグラムや累積相対度数を作成せよ」というものが出たのですが、「生データ」の基準がいまいちよく分かりません。 私としては、テーマを「地震の規模(マグニチュード)と人的被害(人数)」として作成したいと考えております。 検索したところ気象庁のページより http://www.seisvol.kishou.go.jp/eq/higai/higai1996-new.html このようなものが見つかったのですが、これは生データでは無いような気がしたので質問をしました。 このテーマにあった生データとはどのようなものを指すのでしょうか?

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

生データというのは原データということで良いのでしょうかね。私は原データといっていますが、、、 厳密な意味では気象庁で公表されているデータは原データとはいえないかもしれません。これは実際に観測された数値を分かりやすくまとめたものでしょうからね。 > 「生データ」の基準がいまいちよく分かりません。 実験や調査によって得られたデータであって、何も加工されていないデータのことと考えれば問題ないですね。例えば、最も分かりやすくいえば線形変換(ex.対数変換とか角変換のことですね)されたデータは原データではないですよね。 地震とかの数値がどのように観測されるのか分からないのですが、マグニチュード5.5とかはともかく、人的被害はかなり"はしょられている"という感じがしなくもないのです。 ただしこれは原データとして扱っても良いものだと思いますよ。例えばマグニチュード(の値が)が大きければ人的被害(の数)が大きいというような議論はできると思います。

関連するQ&A

  • 気象庁マグニチュードとモーメントマグニチュード

    今回の東日本大地震について、 当初の気象庁マグニチュードでは、8.4であったものが、 その後モーメントマグニチュード9.0と修正されました。 同じ地震でもものさしによって変わり 気象庁マグニチュード<モーメントマグニチュードです。 過去の地震、宝永地震はマグニチュード8.6~8.7 安政東海地震はマグニチュード8.4といわれています。 宝永地震、安政東海地震で示されているマグニチュードは、 気象庁マグニチュードかモーメントマグニチュードか、どっちでしょうか? もし気象庁マグニチュードとすると、 宝永地震の規模は、東日本地震以上の大きさであり、 東日本地震は、最大ではなく、想定の範囲内になると思います。

  • 累積度数

    はじめまして。数学が苦手なのですが、選択科目の抽選で運悪く志望順位がかなり下の数学になってしまいました。課題がどうしても分からないので、くだらない質問かもしれませんが質問させて下さい。 長さ   1     2    3・・(省略)・・     合計 度数   26   12   8・・(省略)・・      51 累積度数 相対度数 というグラフがあり、累積度数が埋めれません。図書館やネットでしらべても、数学が苦手な私にとってはチンプンカンプンで理解できません。 なんとか努力で相対度数は分かった感じです。 例えば長さ1の相対度数は、26÷51で0.509でいいんですよね?(間違っていたらご指摘お願いします) でも、累積度数が分かりません。姉は1×26とか2×12とか長さ×度数だと言っているのですが、友達は授業中にもっと色々計算して気がするのです。 良かったら、私が分かるよう簡単に累積度数の求め方を教えて下さい。 お願いします。

  • 正規確率プロットについて

    正規確率プロットについて 正規確率プロットをエクセルで作成しています. ですが,下記の点で不明な点があり困っています. どなたかわかる方,ご教授お願いします. ・ある本に正規確率プロットの縦軸に累積相対度数とZ値が用いられていました. 都合上,累積相対度数のみでグラフを作成したいのですが,大丈夫でしょうか? ・縦軸に累積相対度数を取る場合,目盛りの範囲は自由にこちらで指定しても大丈夫でしょうか? よろしくお願いします.

  • Excelで "重み付けをした度数分布" を求める

    Excel 2003 を使用しています。データの度数分布を求めたいのですが、単なる度数分布ではなく、"度数に重み付けをする" 必要があります。(数学や統計で用語があるのかもしれませんが、小生には分かりません) 具体的な例を挙げると、左のマトリックスの数字の度数分布に右のマトリックスの重みを乗じた度数分布表やヒストグラムを作りたいと考えています。 42   3  32     1  2  2 21  15  11     3  3  5 10  21   5     5  1  3 通常の度数分布では、 区間 0<x≦10 の度数は2(データ3と5の2個)となりますが、それぞれのデータに右のマトリックスの対応する位置の数字を掛け算した和、3×2+5×3 を度数としたい、ということです。 これを Excel の 分析ツール - ヒストグラム のように、入力範囲とデータ区間を指定するだけで簡単に計算したいのですが、良い方法はないでしょうか。

  • 確率

    3枚の硬貨を同時に投げ、表の出た枚数を記録せよ。この実験を100回行い、そのとき得られる観測相対度数分布を求めよ(図作成)。 これをエクセルで行いたいのですが、どうすれば良いでしょうか? ・表:1、裏:2にして、確率を1/2にする。 ・「乱数発生」で、変数の数を3で100回試行にする。 ・「ヒストグラム」の入力範囲とデータ区間の取り方が分かりません。教えて下さい。 ・おそらく相対なので、100で割ってそれをグラフ化すると思われます。 上記のやり方で良いでしょうか? 宜しくお願いします。

  • エクセルでデーター分布のグラフ作成

    ある生データをもとにデーター分布のグラフ(ヒストグラム?)を作成したいと思っています。 エクセルで作成しますので、操作方法などを分かりやすくご教授願います。 また、このグラフに規格値(Max&Min)も入れたいと思っています。これもエクセルで出来るのでしょうか?

  • 相対累積度数について

    相対累積度数について ボルトの長さを測定したところ、次のような相対累積度数になりました。 長さ……x[mm]とその時の相対累積度数を示します。 30……0.02 31……0.02 32……0.06 33……0.12 34……0.23 35……0.37 36……0.53 37……0.68 38……0.76 39……0.86 40……0.94 41……0.96 42……0.99 43……0.99 44……1 大学の講義で先生にグラフ用紙にだいたいでいいので正規確率グラフを書いてレポートにするように言われました。 また、教科書の問題で、正規確率グラフを使って、ボルトの長さの平均値および標準偏差σを推定せよという問題があります。 教科書には、相対累積度数が0.5のところが平均値と書いています。 また、約0.84のところが平均値+標準偏差に対応するらしいです。 教科書の答えは、長さの平均値が36.5mmで標準偏差が2.8mmです。 でも、相対累積度数が0.5のところは、35mmと36mmの間にあり少しおかしいと思います。 また、標準偏差も、3mmとなりだいたい近い値にはなりますがちゃんとした値になりません。 自分の作成したグラフで、それぞれの点を直線で結んでいるので標準偏差に関しては教科書の言う通りかもしれと思うんですが、相対累積度数についてはなんで36.5mmになるのか分りません。 平均値の出し方も標準偏差の出し方も公式は知っていますので一応出し方は分り、36.5mmと2.8mmになることは分りますが、でも正規確率グラフを見ると少し値がずれてきます。 先生には、完璧な直線にならなければ確率密度関数からずれているということなんですよ、みたいなことは言われはしました。 確かに、グラフは少し直線っぽいけどガタついたグラフになりました。 やっぱり、直線にならなければ、正確な平均値や標準偏差などは出せないんでしょうか? 最小二乗法などで出すんでしょうか? しかし、この講義で最小二乗法は後に習うことになっています。 だから、最小二乗法については知らないことが前提です。 長々とすいません。もう1つ質問があります。 なんで、相対累積度数が約0.84(つまりz=1)のところが平均値+標準偏差になるんでしょうか? 約0.16(つまりz=-1)のところも平均値-標準偏差になるそうなんですが。 どうしてなんでしょうか?納得できるように式などを使っての解説をお願いします。 分りやすい解説をお願いします。

  • 分布形の決定と確率密度関数の算出

    こんにちは。 統計について質問させていただきます。 10,000個のデータ(平均値5.4E-05、標準偏差2.5E-04)を ヒストグラムに変換したところ、その分布形が対数正規分布とみなせそうです。 そこで、ks検定で分布形の推定を行っているのですが、ヒストグラムに対応しそうな 確率密度関数(pdf)と累積分布関数(cdf)の算出が分からず困っております。 ここ何日か、書籍やネットなどで調べてみたものの、何度やってもうまくいきません・・・。 ヒストグラムのデータ区間が小さすぎるのが問題ではないかと考えておりますが。 恥ずかしながら、統計学に関してはあまり学んだことがありませんので、 言葉足らで分かりにくいかと思いますが、 どなたか詳しい方、説明して頂けませんでしょうか。 少しでも分かりやすいように、画像を添付しておきます。 よろしくお願いいたします。

  • 地震がおこる確率はどのようにして計算するのですか

    首都圏M7級地震、京大は「5年以内に28%」 首都圏直下型地震について、京都大防災研究所の研究者が1月時点で、マグニチュード(M)7以上の地震が起きる確率を計算したところ5年以内に30%弱となった。東京大の研究者が昨秋までのデータで試算した4年以内に70%より低いが、注意は必要だという。  京大防災研の遠田晋次准教授は、昨年3月11日~今年1月21日までに首都圏で起きたM3以上の地震を気象庁の観測データから抽出。余震活動の減り方の計算式や、規模が大きい地震ほど発生頻度が低いという法則を組み合わせて、統計的に求めた。  その結果、M7以上の地震が起きる確率は、5年以内に28%、30年以内で64%となった。大震災が起きず、今も地震活動は震災前の水準が続いていると仮定した場合の発生確率は30年以内で44%と試算された。 (http://www.asahi.com/national/update/0201/TKY201202010134.html?ref=gooより引用) 質問 (1)京都大防災研究所は5年以内に30%弱、東京大は4年以内に70%。 これはかなりの違いがあるといえますか? (2)京都大防災研究所は「昨年3月11日~今年1月21日までに首都圏で起きたM3以上の地震を気象庁の観測データから抽出。余震活動の減り方の計算式や、規模が大きい地震ほど発生頻度が低いという法則を組み合わせて、統計的に求めた。」とありますが、東京大はどのような計算で70%と計算したのでしょうか? (3)余震活動の減り方の計算式や、規模が大きい地震ほど発生頻度が低いという法則を組み合わせて という計算のやり方をどう思われますか。 素人考えかもしれませんが、余震活動の減り方とか、規模が大きい地震ほど発生頻度が低いという法則から計算していて、地震の直接の原因を考察していないので地震のメカニズムはほとんどわかっていないのかな、と思いました。 (間違っていれば指摘をお願いします。)

  • 累積相対度数

    累積相対度数 取得単位数 A36 F18 K44 P42 B28 G40 L8 Q32 C44 H38 M26 R6 D22 I24 N40 S16 E44 J42 O24 T26 というデータの表がありまして、取得単位数が20単位の累積度数はいくつかという問題があるのですが、全くわからず困っています。 どなたか解説お願いできますでしょうか?