1K+ 次瀏覽
要檢查一個字串是否為另一個字串的子集,我們可以使用 grepl 函式。例如> Company Job grepl(Job, Company, fixed = TRUE) [1] TRUE這裡我們得到 TRUE,因為 Tutor 是 TutorialsPoint 的子集。> grepl(Company, Job, fixed = TRUE) [1] FALSE這裡我們得到 FALSE,因為 TutorialsPoint 不是 Tutor 的子集。
這可以透過使用 tail 函式來完成。例如> x tail(x,n=1) [1] 1095 > data tail(data,n=1) Class 10 PhD df = data.frame(matrix(rnorm(20), nrow=5)) > tail(df,n=1) X1 X2 X3 X4 5 -0.3595053 0.9943738 0.959761 -0.6565688 > tail(df$X4,n=1) [1] -0.6565688
404 次瀏覽
我們可以使用 options(scipen=999) 來做到這一點。例如> x t.test(x, mu=2000)單樣本 t 檢驗資料:x t = -14.212,df = 9,p 值 = 1.801e-07備擇假設:真均值不等於 200095% 置信區間 -151.3501 659.0499樣本估計 -x 的均值 405.2這裡 p 值是以科學計數法表示的。現在我們可以將其停用,如下所示 -> options(scipen=999) > t.test(x, mu=2000)單樣本 t 檢驗資料:x t = -14.212,df = 9,p 值 = 0.0000001801備擇假設:真均值不等於 200095% 置信區間 -151.3501 659.0499樣本估計 -x 的均值 405.2如果我們想再次啟用科學計數法,那麼它將是 ... 閱讀更多
這可以透過按照我們想要的順序設定變數的級別來完成。例如> data data ggplot(data, aes(x = Class)) + geom_bar()按升序設定級別> data
197 次瀏覽
可以使用方括號重新排序列。例如> df = data.frame(matrix(rnorm(20), nrow=5)) > df X1 X2 X3 X4 1 -0.3637644 2.0770246 0.48763128 -0.09019256 2 -3.1758515 2.3173075 0.86846761 0.38396459 3 1.1844641 0.3412267 1.90986295 -1.03493074 4 -0.5953466 1.7211738 -0.90686896 -0.71215313 5 -0.8732530 0.3256303 0.02312328 -0.36993899假設我們想將列的順序更改為 X3、X2、X4 和 X1,則可以按如下所示完成 -> df[,c(3,2,4,1)] X3 X2 X4 X1 1 0.48763128 2.0770246 -0.09019256 -0.3637644 2 0.86846761 2.3173075 0.38396459 -3.1758515 3 1.90986295 0.3412267 -1.03493074 1.1844641 4 -0.90686896 1.7211738 -0.71215313 -0.5953466 5 0.02312328 0.3256303 -0.36993899 -0.8732530
729 次瀏覽
有三種方法可以查詢向量中元素的索引。例如> x x [1] 8 10 9 6 2 1 4 7 5 3使用 which> which(x == 6)[[1]] [1] 4這裡我們找到了向量 x 中 6 的索引。使用 match> match(c(4,8),x) [1] 7 1這裡我們找到了向量 x 中 4 和 8 的索引。使用 which 和 %in%> which(x %in% c(2,4)) [1] 5 7這裡我們找到了向量 x 中 2 和 4 的索引。
330 次瀏覽
這可以透過簡單地使用 sample 函式來完成。例如> df = data.frame(matrix(rnorm(20), nrow=5)) > df X1 X2 X3 X4 1 -0.3277833 -0.1810403 0.2844406 -2.9676440 2 0.8262923 0.4334449 0.4031084 -1.9278049 3 -0.1769219 -0.1583660 -0.2829540 -0.1962654 4 1.0357773 0.9326049 0.3250011 -1.8835882 5 -1.0682642 -0.6589731 -0.4783144 -0.2945062假設我們要隨機選擇 3 行,則可以按如下所示完成 -> df[sample(nrow(df), 3), ] X1 X2 X3 X4 2 0.8262923 0.4334449 0.4031084 -1.9278049 1 -0.3277833 -0.1810403 0.2844406 -2.9676440 5 -1.0682642 -0.6589731 -0.4783144 -0.2945062
159 次瀏覽
我們可以透過定義 newname 來做到這一點,如下所示 -> Samp Samp sample.1.100..10. 1 47 2 63 3 57 4 16 5 53 6 7 7 54 8 2 9 13 10 14 > colnames(Samp) Samp Sampled Values 1 47 2 63 3 57 4 16 5 53 6 7 7 54 8 2 9 13 10 14由於資料框中只有一列,因此使用物件名稱就足夠了。
350 次瀏覽
在數字前新增零最簡單的方法是使用 paste0 函式例如> ID Gender Lens data data ID Gender Lens 1 25499 1 0.8 2 25500 2 1.2 3 25501 2 1.0 4 25502 1 2.0 5 25503 2 1.8 6 25504 1 1.4假設我們要在每個 ID 前新增 00。可以使用 paste0 函式如下所示 -> IDs newdata newdata IDs Gender Lens 1 0025499 1 0.8 2 0025500 2 1.2 3 0025501 2 1.0 4 0025502 1 2.0 5 0025503 2 1.8 6 0025504 1 1.4
2K+ 次瀏覽
我們可以使用 aggregate 函式或藉助 tapply 來做到這一點例如> x x Category Frequency 1 Graduation 12 2 Graduation 19 3 Post-Graduation 15 4 Graduation 20 5 PhD 25 6 Post-Graduation 13 7 PhD 14使用 aggregate> aggregate(x$Frequency, by=list(Group=x$Category), FUN=sum) Group x 1 Graduation 51 2 PhD 39 3 Post-Graduation 28使用 tapply > tapply(x$Frequency, x$Category, FUN=sum) Graduation PhD Post-Graduation 51 39 28