深度學習和強化學習的區別
隨著我們產生的資料量不斷增加,我們的人工智慧 (AI) 成熟度以及 AI 可能有助於解決的挑戰型別也在不斷增長。這些資料以及目前以可承受的價格提供的強大計算能力,正是推動 AI 技術取得巨大發展的原因,也是深度學習和強化學習得以實現的基礎。在本文中,我將透過提供清晰易懂的定義,解釋深度學習和強化學習之間的區別,這兩種學習方法。
深度學習和強化學習與人工智慧所擁有的計算能力密切相關。這些機器學習的自給自足功能為計算機在提出問題解決方案時制定自己的指導原則鋪平了道路。
深度學習利用先前收集的資料,而強化學習則依靠行之有效的透過實驗學習的方法。
什麼是深度學習?
當時擔任計算機科學教授的 Rina Dechter 於 1986 年首次提出了深度學習的概念。
深度學習利用最新的可用資訊來教演算法如何搜尋相關模式,這在預測資料時至關重要。這樣的系統利用構建方式類似於人腦神經元構成的不同層級的人工神經網路 (ANN)。如果演算法能夠訪問複雜的連結,則它可能能夠處理數百萬條資料並縮小到更精確的預測。
當程式設計師希望軟體識別各種影像中的紫色時,他們可以使用這種學習來訓練軟體。之後,各種影像(一些帶有紫色,一些沒有)將作為“深度學習”過程的一部分呈現給計算機程式。如果軟體有機會透過聚類來做到這一點,它將能夠識別模式並弄清楚何時將顏色標記為紫色。
深度學習用於各種識別程式,包括影像分析以及預測任務,包括時間序列預測。
什麼是強化學習?
一般來說,強化學習將執行操作以最大化獎勵。換句話說,學習是進行活動以獲得有益結果的過程。這與我們學習騎腳踏車的方式非常相似,我們必須經歷失敗才能取得成功。
利用使用者的反饋(哪些不起作用和哪些起作用),我們能夠微調騎腳踏車所需的動作和理解。同樣,計算機使用強化學習並嘗試各種動作;然後,根據他們收到的反饋,他們學習並最終強化成功的動作。
讓我們舉個**例子**。該演算法(稱為強化學習)的應用之一是機器人正在教會自己如何行走。最初,一個足夠大的機器人嘗試向前邁出一步但失敗了。
跌倒的結果是一個數據點,它代表了系統響應強化學習方式的重大進步。由於跌倒是一個作為負反饋來調整系統以嘗試邁出更小一步的結果,因此有必要發生。最終,機器人獲得了向前移動的能力。
深度學習和強化學習的區別
下表突出顯示了深度學習和強化學習之間的主要區別 -
比較依據 | 深度學習 | 強化學習 |
---|---|---|
起源 | 深度學習的概念由 Rina Dechter 於 1986 年提出。 | 強化學習由 Richard Bellman 於 20 世紀 80 年代後期開發。 |
利用 | 在語音和影像識別、降維任務以及深度網路的預訓練領域。 | 特別是在機器人、計算機遊戲、電信、醫療保健中的 AI 和電梯排程領域。 |
資料存在 | 已經存在且學習所需的資料集。 | 由於其探索性,它不需要現有的資料集來學習。 |
與人腦的比較 | 強化學習是一種可以透過反饋改進的人工智慧,這使得它比深度學習更類似於人腦的能力。 | 深度學習主要關注識別,與互動式學習的聯絡較弱。 |
教學方法 | 深度學習可以透過首先分析先前收集的資料,然後將獲得的知識應用於新的資料集來執行所需的操作。 | 可以透過使用強化學習來改變答案,強化學習適應持續的輸入。 |
應用 | 深度學習的應用包括影像和語音識別,以及深度網路預訓練和降維。 | 相比之下,強化學習應用於在處理外部刺激時需要最優控制的情況。一些例子包括機器人、電梯排程、電信、電腦遊戲和醫療保健中的 AI。 |
也稱為 | 深度學習也稱為分層學習或深度結構化學習。 | 強化學習沒有其他常用的術語。 |
結論
深度學習(也稱為強化學習)和計算學習彼此高度相關。深度學習起源於 1986 年,當時 Rina Dechter 首次向學術界提出了這一概念。另一方面,強化學習可以追溯到 20 世紀 80 年代後期,由 Richard Bellman 首次提出。
深度學習用於降維、語音和影像識別以及深度網路預訓練等任務。另一方面,強化學習可以應用於機器人、計算機遊戲、電信、醫療保健中的 AI 和電梯排程等領域。