• ベストアンサー

自然対数に変換する意味がわかりません

ある化学分析の本に、2組の時系列データについて、変動パターンの相関係数を求めるのに、移動平均との比(×100)を自然対数に変換して相関係数を求める、との説明がありました。こういう場合、自然対数に変換するのにどういう意味があるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • ramayana
  • ベストアンサー率75% (215/285)
回答No.5

以下の記述は、厳密ではありません。大体の雰囲気という程度で読んでください。 時系列データを分析するときは、クロスセクションデータとは違った世界で考えることが多いのです。一番大きな違いは、次のことだと思います。 [1] クロスセクションデータでは、すべてのデータが同一の分布に従う確率変数からの実現値(見本)とみなされることが多い。 [2] 時系列データでは、各時点のデータは、それぞれ別の分布に従う確率変数からの実現値とみなされることが多い。 ただ、[2]の想定だけではあまりに漠然としすぎて分析になじまないので、普通、次の仮定を置きます。 [3] 時系列データでは、各時点のデータは、弱定常過程(単に「定常過程」と言うこともある)に従う確率過程からの実現値(見本過程)とみなされることが多い。 弱定常過程の意味は、他の参考書をみていただくとして、その重要な特性に次のことがあります。 [4] 各時点の分散は、時点に依存しない一定値である。 ここからが、本題です。もし、扱っているデータが次の性質を持っているように見えたとします。 [5] データの誤差あるいは分散が、データの値に比例する(例えば、10の値を持つデータの分散が1だったとすると、100の値を持つデータの分散は10になる)。 この[5]のような性質を持つデータは、現実によく見かけるタイプです。さらに、このデータが時間とともに傾向的に増加や減少しているときは、[4]の仮定と矛盾することになります。すると、このままでは弱定常過程にならないので、通常の時系列データの分析手法(相関分析を含む)がほとんど使えないことになってしまいます。 で、このような場合、よく使われるテクニックが、対数変換です。[5]のようなデータも、対数変換すれば、[4]と矛盾しなくなるからです。 よって、結論は、次のようになります。 [6] 時系列データを対数変換したほうが良いかどうかは、単に変動のレンジが大きいかどうかではなく、誤差or分散がデータの値に比例しているかどうかで判断する。

yhb963
質問者

お礼

大変遅くなりましたが、ご教示ありがとうございます。 残念ながら、当方の知識不足のため、ご教示の意味をよく理解できませんでした。 もう少し勉強したいと思います。

その他の回答 (4)

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.4

相関係数というのは、 回帰直線のアテハマリ具合を測るモノサシです。 データのまま相関係数を求めれば、 Y = aX+b という近似を想定したことになります。 対数をとってから相関係数を求めれば、 log Y = a(log X)+b すなわち Y = cX^a という近似を想定して、 そのアテハマリ具合を評価したことになります。 どちらの近似曲線が適切かは、数学ではなく、 それぞれの応用分野(貴方の場合、化学)の問題です。

noname#210617
noname#210617
回答No.3

>時系列データ y(t)が dy(t)/dt = -a * y(t) aは定数 に従うときは その一般解は y(t)=y0 exp(-a * t) となる。 これを自然対数になおせば… 時定数 とか 反応速度 といった言葉を調べてみるといい。

yhb963
質問者

お礼

ありがとうございます。 具体的には、#1さんへのお礼に書いたような場合のことです。そもそも、対数変換する必要があるのでしょうか。

回答No.2

ご質問者の意図は、「なぜ常用対数ではなくて自然対数なんですか」ということでは? 対数変換の意味は#1さんのとおりで、これは常識。 自然対数を求めるのは、元のピーク(液クロとかの)が 誤差関数にフィットでき、それがexpの式になっているから。 あとは、さまざまな公式が自然対数の形であらわされているから。 かと思いますが、別に常用対数でやっても、 簡単に変換できるのだから、どっちでも良いと思います。

yhb963
質問者

お礼

ありがとうございます。 具体的には、#1さんへのお礼に書いたような場合のことです。そもそも、対数変換する必要があるのでしょうか。

  • umamimi
  • ベストアンサー率39% (144/362)
回答No.1

>自然対数に変換するのにどういう意味 ここだけ。 ダイナミックレンジが広いデータは等間隔に並べると全体が大きくなりすぎます。 等間隔なデータは大きな全体から比べると無駄に分解能が高すぎです。 それで、 100倍を2倍、1000倍を3倍で、というように対数で表すと上記の欠点が解消します。

yhb963
質問者

お礼

早々とありがとうございます。ただ、データのレンジが広いわけではないのです。具体的には次のような場合です。 ある環境下で結晶の成長を観察したところ、単位時間当たり、0.5~1.7μの変動幅で直径の増加が見られたとします(成長は次第に鈍化)。そのデータと別環境下で観察したデータとの相関係数を求める時、移動平均との比(×100)をとるのはわかるのですが、その値は100から大きく離れることはありません。なので、なぜ対数をとるのか、その意味がわかりません。

関連するQ&A

  • 対数変換する意味?

    私は数学が苦手な文系大学生です。最近「地域分析」という本を読んでいるのですが、たびたび数式を「対数変換すると・・・」と言う風に話が進みます。対数変換をすることの意味がわからないので内容が理解できません。 まず、対数変換とは何なのか?対数変換を行なうと何がどのように変わるのでしょうか? また、一般的に対数変換とはどのような目的で行なわれるのでしょうか? ということを文系の学生にわかりやすく教えていただけないでしょうか。 対数変換の内容を理解していないため、質問が的を得ていないかもしれませんが、よろしくお願いします。(また、ここで説明できるような内容でなければ、その旨をお伝えください。)

  • T検定後の、対数平均値の逆変換について

    2群の生化学検査値をT検定で比較しようと思っています。 正規分布していないので自然対数変換したのですが、あるサイトを見たところ、 「対数変換値の平均比較である以上、平均値を記載する際には元データの算術平均ではなく、 対数平均値を逆変換した値を用いるべき」 といった旨が書かれてありました。 しかし逆変換後の平均値は元データの平均に比べてかなり低値となってしまいます。 逆変換の必要性は理屈では分かるのですが、算術平均値とはかなり異なり、正直納得できません。 この点に関してどなたか教えて下さい。 お願いします。。

  • 線形変換

    データを線形変換したときに、不偏な統計量は標準偏差、2群の平均値のt値、変動係数、ピアソン相関係数のどれになるのでしょうか?(答えは二つあります) 大変申し訳ありませんがどなたか教えていただくことはできますか。 宜しくお願いいたします。

  • 相関係数

    相関係数を求める計算方法を教えて下さい。 使用するソフトはExcelですが、分析ツール・相関係数を求める関数は使えないというルールがあります。 例として数字を挙げさせていただきます。 A B 1 1059 2 6843 3 7548 4 2489 5 3151 6 2246 7 4832 8 2484 9 1256 10 3218 移動平均を求め、Aと移動平均のデータ間の相関係数を求めるというものです。 移動平均の区間は3とさせていただきます。 よろしくお願いします。

  • 自然対数を用いた重回帰分析

    ネットでたまたま見つけた郵政省(当時)の為替メカニズムの論文を理解したいのですが・・・ 論文では、重回帰分析(?)の結果、為替決定式を以下のとおりとしていました。 logS=α0+α1log(N/N*)+α2log(Y/Y*)+α3(i-i*)・・・式1 logは自然対数 S:為替レート(1ドルS円表示) α0~α3:係数 M:日本のマネーサプライ(M1) M*:アメリカのマネーサプライ(M1) Y:日本のGDP Y*:アメリカのGDP i:日本の短期金利 i*:アメリカの短期金利 logS=20.33+0.59log(N/N*)-0.65log(Y/Y*)+0.03(i-i*)・・・式2 でした。 これにつきまして、 1.logS=の式を、S=の式にするにはどうしたら良いのでしょうか? 自分なりに解いたのは次式です。(おそらく間違っていると思いますが)   S=e^20.33×(M/M*)^0.59÷(Y/Y*)^0.65×e^(0.03(i-i*))・・・式3 2.従属変数(?)が対数表示されている理由は、縦軸を対数表示するため   でしょうか?それとも、回帰分析する際に便利だからでしょうか?   また、金利は自然対数を取らないのですね? 3.自分も式1から、エクセルのソルバ等を用いて計算値と実績値との差の自乗の合計   が最小となる係数を求めてみたいのですが、エクセルのLn関数を用いて、式1から   回帰式を求めることはできますか? 私は文系出身のため対数というものを初めて知りました。とても不思議な世界があるのだなあ と興味を持っていろいろ調べたり、書籍にあたったりしましたが、もともと数学は苦手で基礎 ができていないものですから、いまいち式を解くことができません。 何か良い書籍・ウェブサイトをご紹介願えないでしょうか? (ちなみに、数学はミクロ経済学のための偏微分ができる程度です。)

  • 分析(心理学)で「部分―全体相関係数を求めろ」という課題があるんですが

    分析(心理学)で「部分―全体相関係数を求めろ」という課題があるんですがどうやって求められるんでしょうか? 今心理学の分析をやっているのですが、平均や標準偏差の算出などは分かるのですが「部分―全体相関係数」というものの求め方が分かりません。 分かる方がいらしたら教えていただけると嬉しいです!

  • 実務で役立つ統計知識

    教えてください。 物流の仕事をしています。 在庫量の変動とか出荷頻度とかについて、統計学の初歩中の初歩といえる程度の知識で取り扱いたいです。 下記の項目の意味は理解しましたが、ほかに、「素人に理解しやすく、実務での役に立ちそうなキーワード」はないでしょうか? 中央値 最頻値 加重平均 相乗平均 調和平均 移動平均 トリム平均(調整平均) 中央平均(25%トリム平均) 変動係数 外れ値/異常値 相関係数 ※あくまで素人でも割と簡単に理解できる内容を目指しています

  • 重相関係数のF検定について

    お世話になります。 重相関分析について教えてください。 ●質問1 観測された分散比(F値)はFの臨界値より大きく, 重相関係数は5%の危険率で,「相関無しではない」と判定されました。 しかし,ここの説明変数に対する係数のt検定結果はすべてが有効ではないという結果になりました。予測式を立てる上で問題はないけれど,説明変数に対する係数には意味がないと解釈してよいのでしょうか? -基本的にエクセルの分析ツールを使用してます-- ●質問2 説明変数同士が相互に相関を持つ場合,分析として不適切だと聞きました。(重相関分析の仮定は個々の説明変数に相関がないこと)これを確認するために,スワップ式というのがあると聞きました。これはどこで調べるのがよいでしょうか?また,基本的な教科書やサイトを紹介いただけると幸いです。

  • 行動パターンをグルーピングする統計分析の方法

    数十社分、各社数十個の属性データ(金額等の数値)を時系列で年次5年分あります。 この属性データをもとに幾つかの会社のグループに分けられる行動パターンが分析できないかと思案しています。 この場合のパターンとは例えば各種資産の持ち方の時系列での推移がAグループとBグループで異なる傾向がある等です。 単純な相関分析では属性間の相関しかみれず、各社の行動パターンのグルーピングも出来ない気がします。 この場合適切な統計分析の方法を教えて下さい。よろしくお願いします。

  • 回帰分析や統計学に詳しくなりたい。何か良い本はないでしょうか

    よろしくお願いします。 仕事柄、相関分析などを行うことが多くなったのですが、 この機会に勉強したいと思い、何か良い本などないでしょうか? 相関分析をしても決定係数R^2(Rの2乗)くらいしか見ない ずぶの素人です。 素人からでもわかる回帰分析や、多変量解析入門の本があれば 教えてください。 相関分析をした際にでてくる、自由度やT値、P値の意味が全く分からないので、指標の意味などから解説してある本があれば助かります。 ちなみにエクセルで行っていますので、何か特別なソフトの 解説書ではなく、あくまでもエクセルベースの本だとうれしいです。 よろしくお願いします。