如何獲取包含所有基本統計值的 R 資料框列的彙總統計資訊?


當我們在 R 中應用 summary 函式時,輸出結果會給出最小值、第一四分位數、中位數、平均值、第三四分位數和最大值,但還有許多其他基本統計值可以幫助我們理解變數,例如範圍、總和、平均值的標準誤差、方差、標準差和變異係數。因此,如果我們想找到所有這些值,則可以使用 pastecs 包的 stat.desc 函式,如下面的示例所示。

示例 1

考慮以下資料框:

即時演示

> x1<-rnorm(20)
> x2<-rnorm(20)
> x3<-rnorm(20)
> df1<-data.frame(x1,x2,x3)
> df1

輸出

            x1          x2         x3
1   1.37057327  0.96585723 -1.6824440
2   0.43258556 -2.54077794 -1.5962218
3   0.68188832  1.08144561 -0.9956110
4   0.24553258  0.07541754 -0.3527252
5  -0.19946765  0.49262220 -0.7946248
6  -1.93924451  0.13544724 -0.4184053
7   0.27443524  0.08363552  0.8696729
8  -2.02613035 -0.67827697 -0.8940207
9   0.33772301 -1.51171368  0.4032073
10 -0.44463177  1.69245587  1.7037202
11  1.69256604 -0.60384845  0.7247898
12  0.11356829  1.05543184  0.9780191
13 -0.01516246  0.92529906  0.4805570
14 -0.78159893 -0.55414738 -0.4680645
15 -0.08974609  0.76847977 -0.2780631
16 -0.45456509  1.08361106 -1.6672789
17  1.13920983  0.24680491  1.3922984
18  0.55562889 -0.06529163 -0.7083794
19 -0.11607439  1.09421670  2.1602874
20 -0.78351132  0.48005020  0.3453250

使用 summary 函式查詢 df1 的摘要:

> summary(df1)

輸出

                x1                x2                x3        
 Min.   :-2.0261304   Min.   :-2.5408   Min.   :-1.6824
 1st Qu.:-0.4471151   1st Qu.:-0.1875   1st Qu.:-0.8195
 Median : 0.0492029   Median : 0.3634   Median :-0.3154
 Mean   :-0.0003211   Mean   : 0.2113   Mean   :-0.0399
 3rd Qu.: 0.4633464   3rd Qu.: 0.9883   3rd Qu.: 0.7610
 Max.   : 1.6925660   Max.   : 1.6925   Max.   : 2.1603

載入 pastecs 包並使用 stat.desc 函式查詢 df1 的統計摘要:

> library(pastecs)
> stat.desc(df1)

輸出

                        x1         x2           x3
nbr.val       2.000000e+01 20.0000000  20.00000000
nbr.null      0.000000e+00  0.0000000   0.00000000
nbr.na        0.000000e+00  0.0000000   0.00000000
min          -2.026130e+00 -2.5407779  -1.68244397
max           1.692566e+00  1.6924559   2.16028742
range         3.718696e+00  4.2332338   3.84273139
sum          -6.421540e-03  4.2267187  -0.79796158
median        4.920292e-02  0.3634276  -0.31539416
mean         -3.210770e-04  0.2113359  -0.03989808
SE.mean       2.103941e-01  0.2262258   0.25081489
CI.mean.0.95  4.403600e-01  0.4734961   0.52496160
var           8.853137e-01  1.0235624   1.25816219
std.dev       9.409111e-01  1.0117126   1.12167829
coef.var     -2.930484e+03  4.7872246 -28.11359138

示例 2

即時演示

> y1<-rpois(20,5)
> y2<-rpois(20,2)
> y3<-rpois(20,10)
> y4<-rpois(20,8)
> df2<-data.frame(y1,y2,y3,y4)
> df2

輸出

   y1 y2 y3 y4
1   4  4 10  6
2   4  1  9  8
3   2  3 12  9
4   4  0 11  4
5   7  3  7  7
6   6  0  9 18
7   5  1  7  3
8   6  2  5 10
9   5  1 10  5
10  6  1 12  7
11 11  2  8  7
12  4  2 10 11
13  4  3  7  6
14  4  0 11 15
15 10  1  8  8
16  5  0  6  8
17  3  1 13 14
18  4  1  8  5
19  5  1  5  4
20  8  2 13  5

使用 stat.desc 函式查詢 df2 的統計摘要:

> stat.desc(df2)

輸出

                      y1         y2          y3          y4
nbr.val       20.0000000 20.0000000  20.0000000  20.0000000
nbr.null       0.0000000  4.0000000   0.0000000   0.0000000
nbr.na         0.0000000  0.0000000   0.0000000   0.0000000
min            2.0000000  0.0000000   5.0000000   3.0000000
max           11.0000000  4.0000000  13.0000000  18.0000000
range          9.0000000  4.0000000   8.0000000  15.0000000
sum          107.0000000 29.0000000 181.0000000 160.0000000
median         5.0000000  1.0000000   9.0000000   7.0000000
mean           5.3500000  1.4500000   9.0500000   8.0000000
SE.mean        0.4988144  0.2562380   0.5547641   0.8795932
CI.mean.0.95   1.0440305  0.5363122   1.1611345   1.8410097
var            4.9763158  1.3131579   6.1552632  15.4736842
std.dev        2.2307657  1.1459310   2.4809803   3.9336604
coef.var       0.4169656  0.7902973   0.2741415   0.4917076

更新於: 2021-03-05

269 次檢視

啟動您的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.