暇人の研究室

金融工学やR言語・統計学について書いてます。

<

【R言語】Rによる単回帰分析 その2

 

 

前回行った回帰分析の結果の説明を行っていきます。

 

> summary(lm)   ##分析結果の要約

Call:
lm(formula = sv[, 1] ~ sv[, 2], data = sv)

Residuals:
Min 1Q Median 3Q Max
-9.6615 -1.3700 -0.0903 0.9603 18.6892

Coefficients:
     Estimate    Std.       Error    t value Pr(>|t|)

(Intercept) 0.09089   0.16589  0.548    0.584 

sv[, 2]   0.97049 0.12453    7.793   1.95e-13 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.585 on 241 degrees of freedom
Multiple R-squared: 0.2013, Adjusted R-squared: 0.198
F-statistic: 60.73 on 1 and 241 DF, p-value: 1.951e-13

 

分析結果は回帰式の定数項が0.09089、係数は0.9749、つまり下のような推定式がデータにもっとも当てはまると言っているわけです。

 

任天堂の株価収益率=0.9749×TOPIXの収益率+0.09089

 

一応、分析結果の他の項目の見方についても触れておきます。

 

Residuals: 残差に関する基本統計量(平均・分散などのこと)を示しています。右から第一四分位範囲・最小値・第三四分位範囲・最大値を示しています。

 

Coefficients: Estimateの部分が分析結果の回帰係数を表しています。(intercept)のところが定数項、sv[,2]のところが係数を示しています。t-valueはt値を示しており、t値は、「回帰係数がゼロである」という仮説検定の統計量でt値が低いと分析結果の信頼性は低いとされます(2以上が望ましい)

 

Residual:  R-squaredは決定係数を示しています。(1に近いほど分析結果の信頼性は高い、0.5あればベスト) Adjusted R-squaredは調整済み決定係数(重回帰分析のときに見る決定係数)を示しています。 F値P値は「全ての回帰係数が0である」という帰無仮説のもと仮説検定した時の統計量となります。