區分 R 中的分類和數值自變數。
對於分類變數,每個水平都被視為一個自變數,並由因子函式識別。另一方面,數值自變數本質上是連續的或離散的。
檢視下面給出的線性迴歸模型摘要示例,以瞭解分類和數值自變數之間的區別。
示例
以下程式碼片段建立了一個示例資料框 -
x<-rpois(20,2) y<-rpois(20,5) df<-data.frame(x,y) df
建立了以下資料框
x y 1 1 1 2 4 5 3 3 10 4 3 4 5 1 6 6 3 4 7 1 2 8 1 10 9 1 6 10 2 5 11 1 2 12 3 4 13 0 5 14 1 5 15 4 5 16 4 7 17 3 5 18 2 4 19 1 3 20 2 6
要為 df 中的資料建立線性模型並在上述建立的資料框上查詢模型摘要,請將以下程式碼新增到上述程式碼片段中 -
x<-rpois(20,2) y<-rpois(20,5) df<-data.frame(x,y) Model_1<-lm(y~x,data=df) summary(Model_1)
輸出
如果您將上面給出的所有程式碼片段作為一個程式執行,它將生成以下輸出 -
Call:
lm(formula = y ~ x, data = df)
Residuals:
Min 1Q Median 3Q Max
-3.549 -1.313 -0.503 1.128 5.451
Coefficients:
Estimate Std. Error t value Pr(|t|)
(Intercept) 4.168 1.013 4.11 0.00065 ***
x 0.382 0.426 0.90 0.38249
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.29 on 18 degrees of freedom
Multiple R-squared: 0.0426, Adjusted R-squared: -0.0106
F-statistic: 0.801 on 1 and 18 DF, p-value: 0.382要為 df 中的資料建立線性模型,並將作為因子變數,並在上述建立的資料框上查詢模型摘要,請將以下程式碼新增到上述程式碼片段中 -
x<-rpois(20,2) y<-rpois(20,5) df<-data.frame(x,y) Model_1<-lm(y~x,data=df) Model_2<-lm(y~factor(x),data=df) summary(Model_2)
輸出
如果您將上面給出的所有程式碼片段作為一個程式執行,它將生成以下輸出 -
Call:
lm(formula = y ~ factor(x), data = df)
Residuals:
Min 1Q Median 3Q Max
-3.375 -1.400 -0.533 1.083 5.625
Coefficients:
Estimate Std. Error t value Pr(|t|)
(Intercept) 5.00e+00 2.50e+00 2.00 0.064 .
factor(x)1 -6.25e-01 2.65e+00 -0.24 0.817
factor(x)2 -3.92e-15 2.89e+00 0.00 1.000
factor(x)3 4.00e-01 2.74e+00 0.15 0.886
factor(x)4 6.67e-01 2.89e+00 0.23 0.820
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.5 on 15 degrees of freedom
Multiple R-squared: 0.0526, Adjusted R-squared: -0.2
F-statistic: 0.208 on 4 and 15 DF, p-value: 0.93
廣告
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP