如何在 R 資料幀的因子級別中按各個列求和?


如果資料幀包含一個因子列和一些數值列,則我們可能希望查詢因子級別的數值列的總和。為此,我們可以使用 aggregate 函式。例如,如果我們有一個數據幀 df,其中包含由 Group 定義的因子列和一些數值列,則可以透過使用 aggregate(.~Group,data=df,sum) 計算因子級別的按各個列求和。

示例 1

 即時演示

考慮以下資料幀 −

Group<−factor(sample(c("A","B","C"),20,replace=TRUE))
frequency<−sample(1:10,20,replace=TRUE)
cost<−round(rnorm(20,25,6),2)
df1<−data.frame(Group,frequency,cost)
df1

輸出

  Group frequency cost
1  A    6        21.69
2  C    5        34.94
3  C    3        17.32
4  B    3        16.84
5  A    10       23.10
6  C    3        30.30
7  B    8        19.84
8  A    1        25.41
9  C    2        27.55
10 A    10       26.31
11 B    7        33.05
12 A    10       32.09
13 B    1        27.36
14 A    9        19.70
15 A    5        26.44
16 A    10       28.28
17 C    6        25.67
18 A    9        24.06
19 C    3        22.25
20 A    5        24.93

尋找 frequency 和 cost 在 Group 中的水平和 −

示例

aggregate(.~Group,data=df1,sum)
Group frequency cost

輸出

1 A 75 252.01
2 B 19 97.09
3 C 22 158.03

示例 2

 即時演示

Class<−sample(c("First","Second","Third"),20,replace=TRUE)
Price<−sample(2000:5000,20)
Seats<−sample(0:9,20,replace=TRUE)
df2<−data.frame(Class,Price,Seats)
df2

輸出

Class Price Seats
1 Third 2218 4
2 Second 3064 4
3 Third 4074 2
4 First 4394 4
5 First 2321 3
6 Third 4998 1
7 First 3520 2
8 First 4133 1
9 Third 4832 9
10 Second 2856 0
11 Third 3145 7
12 Third 4604 6
13 Second 4691 9
14 First 4994 4
15 Third 2252 2
16 First 3491 0
17 Second 4125 7
18 Second 2597 2
19 Third 3720 3
20 Second 2995 0

尋找 Price 和 Seats 在 Class 中的水平和 −

示例

aggregate(.~Class,data=df2,sum)

輸出

Class Price Seats
1 First 22853 14
2 Second 20328 22
3 Third 29843 34

更新於: 2021 年 02 月 05 日

564 次瀏覽

開啟你的 職業生涯

完成課程以獲得認證

開始學習
廣告
© . All rights reserved.