基於部件的識別理論
結構描述理論和觀察者概念是人類心理學中發展出的兩種最突出的物體識別框架。結構描述理論認為,僅僅觀察物體的輪廓就足以識別物體。與之相反,觀察者方法提出,所有實體的特徵都被記住,即使它們對識別並不重要。
什麼是基於部件的識別理論?
Irving Biederman於1987年提出了基於部件的識別概念(RBC),以解釋物體識別過程。基於部件的識別理論指出,要理解任何事物,都必須將其分解成其組成部分或幾何元。如果您熟悉Biederman的基於部件的識別理論,您就會知道幾何元是代表實體最簡單部分的平面或三維形狀。不同形狀的幾何元,例如圓柱體和圓錐體。它們可以以不同的方式組合,構成無數種不同的物體。基於物體由其組成部分識別的概念,每個人每天遇到的物體都由少於35種表徵組成。
處理階段
有一些過程可以識別物體或部件。這些階段被認為是級聯排列的。早期的邊緣提取階段對錶面特徵(如亮度、紋理或顏色)的差異很敏感,並提供物體的線圖解釋。部件的位置類似於記憶中的表徵,並且假定匹配是並行發生的,具有無限的能力。這個階段模型已經被提出,以提供一個總體的理論背景。當物體的影像投射到視網膜上時,基於部件的識別模型假設它是一個分割影像的表示。然後,每個分割區域都被近似為一組可能的簡單部件之一,稱為幾何元,可以用廣義圓錐體建模。基於部件的識別的基本感知假設是,部件可以基於二維影像中易於檢測到的感知特性來區分。因此,基於部件的識別提供了對感知組織和模式識別之間經典現象關係的原理性解釋。
顏色和紋理
之前的解釋主要基於邊緣。像顏色、亮度和紋理這樣的表面特徵通常在原始訪問中只扮演次要角色。這應該解釋為除了暗示表面特徵的識別相對於部件的感知固有地延遲之外的其他內容。然而,在大多數情況下,表面特徵通常是訪問計數專案的劃分效率較低的途徑。例如,椅子同時具有特定的顏色和紋理以及其部分解釋,但這只是體積解釋,它可以有效地訪問椅子的心理表徵。
部件之間的關係
相似部件的不同位置很容易導致不同的物體。原始物及其排列之間的相同情況存在於單詞的音素表示中,其中給定的音素部分可以重新排列以構成不同的單詞。物體的表示將是表達部件之間關係的結構描述。這些關係包括部件的相對大小、方向及其連線位置的規範。
實驗證據
實驗參與者表現出非凡的能力,即使在視覺噪聲的情況下也能理解物體,只要幾何元可見。
特徵關係資料的去除是幾何元損壞與物體識別之間的關係。
即使在試驗之間使用不同的幾何元,也不存在視覺簡短。
該理論的優勢和劣勢
使用幾何元作為結構原始具有兩個主要優點。因為幾何元是基於在不同視角下一致的物體屬性建立的,所以所有幾何元都可以被視為獨特或獨一無二的。單個幾何元描述足以從所有可能的視角解釋一個物體。基於部件的識別理論的第二個好處是它實現了顯著的表徵經濟性。數量有限的幾何元組合產生一個簡單的字母表,可以從複雜的事物中產生。例如,僅使用24個幾何元,3060億個三個幾何元的組合就允許理解所有可能的事物。基於部件的識別理論本身無法從真實物體的照片開始,並建立該物體的幾何元和關係描述。基於部件的識別理論並沒有試圖提供機制來降低現實場景的複雜性到簡單的幾何形狀。基於部件的識別理論本身無法獲取真實物體的快照並提供該物體的幾何元和關係描述。基於部件的識別理論並沒有試圖提供機制來降低現實世界場景的複雜性到基本的幾何形狀。在這些幾何元中,必須滿足基於部件的識別理論,並且它們之間的關係只能在許多真實物體之間才能辨別。例如,梨和蘋果很容易被人區分,但缺乏基於部件的識別理論所需的角和邊來理解它們的差異。Biederman還認為,這種差異解釋了研究結果,即物體的理解在視角變化時可能不會同樣好。
優勢 | 劣勢 |
---|---|
使用幾何元作為結構原始帶來兩個主要優勢。 |
相對較少數量的幾何元形成了一個簡單的字母表,可以從複雜物體中產生。 |
結論
根據上述解釋,Irving Biederman在1987年建立了基於部件的識別理論,這表明人類可以透過將物體分解成幾何元來理解物體。已經研究了處理階段、顏色、紋理、部件之間的關係以及基於部件的識別理論的優缺點。基於部件的識別理論是有用的,因為它允許我們獨立於視角來理解物體。這也稱為視角不變性。幾何元的非變邊緣特徵是這種現象的原因。