簡介 在處理時間序列資料時,至關重要的是採用一種考慮資料時間順序的交叉驗證方法。這是因為時間序列資料顯示出自相關性,這意味著資料點的值與其先前值相關。因此,與許多其他機器學習應用不同,資料不能被認為是獨立且同分布的 (iid)。標準的 k 折交叉驗證技術將資料隨機分成 k 折,並在 k-1 折上訓練模型,然後在剩餘的折上進行測試,這對於時間序列資料來說是不夠的。… 閱讀更多
簡介 KNN 和 k 均值聚類是兩種常用的機器學習技術,用於各種任務。這兩種方法都使用 k 引數,但它們應用於不同的問題,並且工作方式不同。在分類和迴歸問題中,KNN 是一種監督學習方法,而 k 均值聚類是一種無監督學習方法。在本文中,我們將探討 KNN 和 k 均值聚類之間的主要區別,包括每種方法的學習風格、任務、輸入、距離計算、輸出、應用和限制。我們可以為手頭的任務選擇最佳演算法,並避免常見的… 閱讀更多