機率學習:含義和意義
在給定課程和整個進步過程中,個人獲得機率資料以即時驅動活動的程度尚不清楚。然而,人們會跟蹤機率,例如周圍環境中事件之間的關係。成人和兒童參加了兩項測試,他們在隨機機率分配的站點尋找隱藏的獎勵。幼兒和成人都在實驗室中調整了他們的策略,以在實驗過程中更好地最大化他們的獎勵。然而,成年人在切換策略方面更為有效。延遲成功的策略會改變成人和兒童,從而增加理解既定機率的難度。總的來說,這些發現說明了幼兒和成人對新知識的適應能力,以及他們如何改變自己的行為。
什麼是機率學習?
在學習科學中,使用機率學習的實證主義正規化是一種常見的做法。這些實驗的參與者通常被要求預測多個輸入或事件中的一個。隨著他們獲得更多知識,他們的預測將越來越接近反映各種情況的真實可能性。
兒童的機率學習
即使在很小的年齡,兒童也表現出對機率資料的興趣。例如,一群 7 個月大的新生兒觀察了一位研究人員從一個盒子裡抽出一系列球,這個盒子中紅色球的數量明顯多於白色球。當研究人員抽出一系列白色球時,嬰兒比研究人員抽出一系列紅色球時,注視盒子的時間長得多。嬰兒意識到這些結果沒有反映盒子內顏色的分佈,這將在這些統計資料中得到體現。學齡前兒童在得出結論時也會考慮集合的抽樣分佈。當他們發現從一套彩色積木中取出一塊特定的積木可以觸發玩具的音樂和燈光時,他們感到驚訝。孩子們關於哪種顏色的積木觸發了玩具的理論反映在紅色和藍色積木的相對丰度中。
示例
所有年齡段的孩子都可以從學習識別和跟蹤機率中受益,並且還可以利用這些知識來指導他們的行為。例如,一個兩歲的孩子被展示了兩個物體,並被告知根據哪個物體更有可能啟用燈光和音樂來選擇其中一個,他選擇了更有可能的選擇。另一項研究中的學齡前兒童利用機率資料來對代理人的玩具請求做出適當的回應:那些之前見過代理人從盒子裡選擇最不常見的玩具型別的兒童後來給了代理人這種型別的玩具;那些之前見過代理人從盒子裡選擇最常見的玩具型別的兒童在為代理人選擇玩具時沒有表現出偏好。這些例子表明,孩子們如何利用機率資料來學習和回應周圍的環境。
機率學習的規模
研究人員設計了一項機率學習任務來調查孩子們如何隨著時間的推移利用他們不斷增長的知識庫。機率學習活動中的機率資訊通常在多個試驗中提供給學習者。在最簡單的機率學習任務形式中,參與者可以選擇兩種替代方案中的一種,並被要求再次做出相同的決定,其中一種替代方案獲得更高的強化率。使用者不會收到有關這些隱藏機率的資訊,因此他們必須依靠自己的觀察結果在未來的試驗中做出良好的決定。從這些努力中收集的資訊通常被解釋為一個人在實驗期間的常規行為。這意味著以前的研究未能闡明人們是否會隨著年齡和經驗的增長而調整他們對知識的使用來改善他們的行為。
根據跨試驗彙總的資料,研究人員發現人們在解決這些機率學習任務時採用了兩種不同的方法:“機會匹配”和“最大化”。在一種稱為“機率匹配”的方法中,玩家會根據行動導致積極結果的可能性來選擇行動。
機率學習的變化
具有機率學術科目的人在各種任務結構甚至種族中始終如一地表現出匹配行為。這裡諷刺的是,透過匹配,最終獲得的獎勵比最大化時少。因為即使他們知道平均獎勵頻率,使用者仍然不知道何時會獎勵特定位置或答案選擇。
機率學習的變化
與上面討論的新生兒和幼兒研究不同,如上所述,機率教學策略提供了跨年齡的直接比較。然而,在機率學習任務的研究中,關於年齡差距的描述存在差異,特別是在匹配和最大化方面。多項研究表明,學齡兒童的匹配率與成年人相當,並且比同齡的成年人更多地進行了最大化。另一些人發現,成年人比年輕人更善於最佳化獎勵。也許以前的研究對整個實驗環節的行為進行了平均,因此難以辨別發展差異。雖然使用更常見的機率學習任務的研究與前面描述的研究不同,但它們尚未檢測到持續的行為變化。
結論
透過使用一種分析方法,該方法允許對機率訓練過程中的行為進行連續測量,我們可以開始理解是否需要獲取更多關於受影響區域行為隨時間推移的基本機率結構的知識。此外,透過招募不同年齡段的參與者,我們可以評估生活經驗的影響,並觀察人們的機率思維能力是否會隨著年齡的增長而發展。每位參與者都進行了一項挑戰,其中他們被提供了多個選擇,每個選擇都會以不同的數量增加他們獲勝的機會。在整個試驗中,我們跟蹤了參與者的決策並分析了任何可識別的趨勢。關於人們是否會在單個實驗過程中改變他們的行為,以及如果改變,會發展哪些趨勢,這一點尚不清楚,因為過去的研究通常對試驗塊中的參與者行為進行了平均。我們預測早期行為將與機會匹配相符。然而,根據機率學習理論,如果在實驗過程中記錄了特定的行為,那麼行為將逐漸與最大化相符。