
- 機器學習基礎
- ML - 首頁
- ML - 簡介
- ML - 入門
- ML - 基本概念
- ML - 生態系統
- ML - Python 庫
- ML - 應用
- ML - 生命週期
- ML -所需技能
- ML - 實現
- ML - 挑戰與常見問題
- ML -侷限性
- ML - 真實案例
- ML - 資料結構
- ML - 數學基礎
- ML - 人工智慧
- ML - 神經網路
- ML - 深度學習
- ML - 獲取資料集
- ML - 分類資料
- ML - 資料載入
- ML - 資料理解
- ML - 資料準備
- ML - 模型
- ML - 監督學習
- ML - 無監督學習
- ML - 半監督學習
- ML - 強化學習
- ML - 監督學習 vs. 無監督學習
- 機器學習資料視覺化
- ML - 資料視覺化
- ML - 直方圖
- ML - 密度圖
- ML - 箱線圖
- ML - 相關矩陣圖
- ML - 散點矩陣圖
- 機器學習統計學
- ML - 統計學
- ML - 均值、中位數、眾數
- ML - 標準差
- ML - 百分位數
- ML - 資料分佈
- ML - 偏度和峰度
- ML - 偏差與方差
- ML - 假設
- 機器學習中的迴歸分析
- ML - 迴歸分析
- ML - 線性迴歸
- ML - 簡單線性迴歸
- ML - 多元線性迴歸
- ML - 多項式迴歸
- 機器學習中的分類演算法
- ML - 分類演算法
- ML - 邏輯迴歸
- ML - K 近鄰演算法 (KNN)
- ML - 樸素貝葉斯演算法
- ML - 決策樹演算法
- ML - 支援向量機
- ML - 隨機森林
- ML - 混淆矩陣
- ML - 隨機梯度下降
- 機器學習中的聚類演算法
- ML - 聚類演算法
- ML - 基於質心的聚類
- ML - K 均值聚類
- ML - K 中值聚類
- ML - 均值漂移聚類
- ML - 層次聚類
- ML - 基於密度的聚類
- ML - DBSCAN 聚類
- ML - OPTICS 聚類
- ML - HDBSCAN 聚類
- ML - BIRCH 聚類
- ML - 親和傳播
- ML - 基於分佈的聚類
- ML - 凝聚層次聚類
- 機器學習中的降維
- ML - 降維
- ML - 特徵選擇
- ML - 特徵提取
- ML - 向後剔除法
- ML - 前向特徵構建
- ML - 高相關性過濾器
- ML - 低方差過濾器
- ML - 缺失值比率
- ML - 主成分分析
- 強化學習
- ML - 強化學習演算法
- ML - 利用與探索
- ML - Q 學習
- ML - REINFORCE 演算法
- ML - SARSA 強化學習
- ML - 演員-評論家方法
- 深度強化學習
- ML - 深度強化學習
- 量子機器學習
- ML - 量子機器學習
- ML - 使用 Python 的量子機器學習
- 機器學習雜項
- ML - 效能指標
- ML - 自動工作流程
- ML - 提升模型效能
- ML - 梯度提升
- ML - 自舉匯聚 (Bagging)
- ML - 交叉驗證
- ML - AUC-ROC 曲線
- ML - 網格搜尋
- ML - 資料縮放
- ML - 訓練和測試
- ML - 關聯規則
- ML - Apriori 演算法
- ML - 高斯判別分析
- ML - 成本函式
- ML - 貝葉斯定理
- ML - 精度和召回率
- ML - 對抗性
- ML - 堆疊
- ML - 輪次
- ML - 感知器
- ML - 正則化
- ML - 過擬合
- ML - P 值
- ML - 熵
- ML - MLOps
- ML - 資料洩露
- ML - 機器學習的商業化
- ML - 資料型別
- 機器學習 - 資源
- ML - 快速指南
- ML - 速查表
- ML - 面試問題
- ML - 有用資源
- ML - 討論
監督學習與無監督學習
監督學習和無監督學習是機器學習中兩種流行的方法。區分監督學習和無監督學習最簡單的方法是訓練資料集的型別和模型的訓練方式。但是,還有其他區別,本章將進一步討論。
什麼是監督學習?
監督學習是一種機器學習方法,它使用標記資料集來訓練模型,使其成為分類資料或預測輸出的理想選擇。監督學習分為兩種型別:
1. 分類
分類使用演算法來預測類別值,例如確定電子郵件是否為垃圾郵件,或者它是真還是假。該演算法學習將每個輸入對映到其對應的輸出標籤。一些常見的演算法包括 K 近鄰、隨機森林和決策樹。
2. 迴歸
迴歸是一種統計方法,用於分析資料點之間的關係。它可用於根據位置和大小等特徵預測房價,或估計未來的銷售額。一些常見的演算法包括線性迴歸、多項式迴歸和邏輯迴歸。
什麼是無監督學習?
無監督學習是一種機器學習方法,用於在原始和未標記的資料上訓練模型。這種方法通常用於在沒有人工監督的情況下識別資料中的模式。無監督學習模型用於以下任務:
1. 聚類
此任務使用無監督學習模型根據其相似性將資料點分組到叢集中。常用的演算法是K 均值聚類。
2. 關聯
這是另一種型別的無監督學習,它使用預定義規則將資料點分組到叢集中。它通常用於市場籃子分析,此任務背後的主要演算法是 **Apriori 演算法**。
3. 降維
這種無監督學習方法用於透過去除不必要的特徵來減小資料集的大小,而不會影響資料的原始性。
監督學習和無監督學習的區別
下表顯示了監督學習和無監督機器學習之間的一些關鍵區別:
依據 | 監督學習 | 無監督學習 |
---|---|---|
定義 | 監督學習演算法訓練資料,其中每個輸入都有對應的輸出。 | 無監督學習演算法查詢沒有預定義標籤的資料中的模式。 |
目標 | 監督學習的目標是根據輸入特徵進行預測或分類。 | 無監督學習的目標是發現隱藏的模式、結構和關係。 |
輸入資料 | 標記的:具有相應輸出標籤的輸入資料。 | 未標記的:輸入資料是原始的和未標記的。 |
人工監督 | 監督學習演算法需要人工監督來訓練模型。 | 無監督學習演算法不需要任何監督來訓練模型。 |
任務 | 迴歸、分類 | 聚類、關聯和降維 |
複雜度 | 監督機器學習方法在計算上比較簡單。 | 無監督機器學習方法在計算上比較複雜。 |
演算法 | 線性迴歸、K 近鄰、決策樹、樸素貝葉斯、SVM | K 均值聚類、DBSCAN、自編碼器 |
準確性 | 監督機器學習方法非常準確。 | 無監督機器學習方法的準確性較低。 |
應用 | 影像分類、情感分析、推薦系統 | 客戶細分、異常檢測、推薦引擎、自然語言處理 |
監督學習或無監督學習 - 選擇哪個?
選擇正確的方法至關重要,並且還會決定結果的效率。為了決定哪種學習方法最好,應考慮以下事項:
- 資料集 - 評估資料,無論是標記的還是未標記的。你還需要評估是否有時間、資源和專業知識來支援標記。
- 目標 - 定義你試圖解決的問題和你試圖選擇的解決方案也很重要。它可能是分類、發現數據中的新模式或見解,或建立預測模型。
- 演算法 - 透過確保演算法與所需維度(例如屬性和特徵數量)匹配來審查演算法。此外,評估演算法是否可以支援資料的數量。
半監督學習
如果你在選擇監督學習和無監督學習之間猶豫不決,半監督學習是最安全的方法。這種學習方法結合了監督學習和無監督學習,其中使用的資料集的一小部分被標記,大部分未被標記。當你有大量資料使得難以識別相關特徵時,這是理想的選擇。
廣告