資料結構中的矩形資料
多元橫截面資料(即非時間序列或重複測量資料)由矩形資料表示,其中每一列是一個變數(特徵),每一行是一個案例或記錄。
表示矩形資料的第一個方法是將其對映到更高維度的點資料,並使用基於點的數結構過程,例如網格檔案、PR四叉樹、點四叉樹和k-d樹。將矩形資料對映到四維點的過程可以用多種技術來執行,例如對面角的x和y座標,或一個角的x和y座標以及寬度和高度等。基於點的矩形資料表示的缺點是它們無法利用資料的區域性性來提高儲存和空間操作的效率。
表示矩形資料的第二個方法是根據其組成的線段和基於線的數結構過程,例如PM四叉樹、PMR四叉樹等。基於線的矩形資料表示的缺點是,根據其線段指定的空間操作可能不滿足操作的條件,而它們組成的矩形卻滿足這些條件。
表示矩形資料的第三個方法是根據其佔據的面積。諸如MX-CIF四叉樹和R樹之類的過程將矩形資料組織成最低邊界框的分層分組。對於MX-CIF四叉樹,它實現基於空間的
四叉樹劃分,其中每個矩形與其最低的封閉四叉樹塊相關聯。在R樹中,矩形資料被劃分為分層巢狀的最低邊界框。R樹的缺點是,沒有實現資料的區域性性。
廣告