如何對這類資料進行泛化處理?


集合值屬性可以是同構的或異構的。通常,集合值資訊可以透過以下方式進行泛化:

  • 將集合中每個值泛化到其等效的更高級別概念。

  • 推匯出集合的通常行為,包括集合中的多個元素、集合中的型別或值範圍、統計資料的加權平均值或集合形成的主要叢集。

  • 此外,可以使用多個泛化運算子來分析替代泛化路徑來實現泛化。在這種方法中,泛化的結果是異構集合。

示例 - 假設一個人的愛好是一個集合值屬性,包含值集合{網球、曲棍球、足球、小提琴、模擬城市}。這個集合可以泛化到一組高級別概念,例如{運動、音樂、電腦遊戲},或者泛化到數字 5(即集合中愛好的數量)。

此外,可以將計數與泛化值相關聯,以表示有多少元素被泛化到該值,例如{運動 (3)、音樂 (1)、電腦遊戲 (1)},其中運動 (3) 表示三種類型的運動,等等。

集合值屬性可以泛化到集合值屬性或單個值屬性;如果值形成格或“層次結構”,或者如果泛化遵循多條路徑,則單個值屬性可以泛化到集合值屬性。對這種泛化集合值屬性的進一步泛化必須遵循集合中每個值的泛化路徑。

列表值屬性和序列值屬性的泛化方式與集合值屬性類似,只是列表或序列中元素的順序應在泛化中保留。

此外,可以根據列表的一般行為對其進行泛化,包括列表的長度、列表元素的型別、值範圍、數學資料的加權平均值,或者透過降低列表中不重要的元件。列表可以泛化成列表、集合或單個值。

複雜結構值屬性可能包含集合、元組、列表、樹、記錄及其組合,其中一個結構可以在任何級別巢狀在另一個結構中。

  • 一般來說,結構值屬性可以透過多種方式進行泛化,例如在保持結構形狀的同時泛化結構中的每個屬性。

  • 它用於展平結構並泛化展平的結構。

  • 它可以透過高級別概念或聚合來總結低級別結構。

  • 它可以返回結構的型別或概述。

更新於:2022年2月17日

473 次瀏覽

啟動你的職業生涯

完成課程獲得認證

開始學習
廣告