如何視覺化資料以支援互動式決策樹的構建?


基於感知的分類 (PBC) 是一種基於多維視覺化方法的互動式方法,使使用者能夠在構建決策樹時整合有關資料的背景知識。

透過以視覺方式與資料互動,使用者更有可能對資料產生更深入的理解。由此產生的樹可能比使用傳統決策樹歸納技術構建的樹更小,因此更容易解釋,同時也能達到類似的準確率。

PBC 需要一種畫素導向的方法來考慮其類別標籤資料的多維資料。採用圓形分割方法,該方法將 d 維資訊物件對映到一個圓上,該圓被分成 d 個段,每個段定義一個屬性。

資料元素的屬性值對映到一個彩色畫素,反映物件的類別標籤。對每個資料物件的每個屬性-值對完成此對映。對每個屬性完成排序以確定段內的排列順序。

例如,可以組織給定段內的屬性值,以便在相似的屬性值內顯示同質(關於類別標籤)區域。一次可以預期到的訓練資訊量大約由多個屬性和多個數據物件的乘積決定。

PBC 系統顯示一個分屏,包括資料互動視窗和知識互動視窗。資料互動視窗顯示正在檢查的資料的圓形段,而知識互動視窗顯示迄今為止構建的決策樹。整個訓練集視覺化在資料互動視窗中,而知識互動視窗顯示一個空決策樹。

傳統的決策樹演算法僅允許對統計屬性進行二元分割。PBC 使使用者能夠定義多個分割點,從而導致從單個樹節點生長出多個分支。

樹的構建方式如下。使用者在資料互動視窗中檢視多維資料並選擇一個分割屬性和多個分割點。知識互動視窗中的現代決策樹得到擴充套件。

使用者選擇決策樹的一個節點。使用者可以為該節點建立類別標籤(這將該節點建立為葉子)或請求視覺化等效於該節點的訓練資訊。這將導致視覺化每個屬性(除了用於分割沿從根到該節點路徑上的元素的屬性)的新視覺化。互動過程持續進行,直到為決策樹的每個葉子建立了一個類別。

更新於: 2022-02-18

166 次檢視

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.