什麼是屬性?
屬性是一個數據欄位,定義了資料物件的特徵。在文獻中,屬性、維度、特徵和變數這些名詞是對應使用的。維度通常用於資料倉庫。機器學習文獻傾向於使用術語“特徵”,而統計學家則更喜歡術語“變數”。
資料探勘和資料庫專家通常使用術語“屬性”。例如,定義使用者物件的屬性可以包括客戶 ID、姓名和地址。給定屬性的觀察值稱為觀察結果。
一組可以定義給定物件的屬性被稱為屬性向量(或特徵向量)。包含一個屬性(或變數)的資料分佈稱為單變數。雙變數分佈包含兩個屬性,依此類推。
屬性的型別由其可能值的集合決定,包括名義、二元、有序或統計屬性。
名義屬性 - 名義屬性定義與名稱相關聯。名義屬性的值是事物的符號或名稱。每個值定義某種型別的類別、程式碼或狀態等。名義屬性被定義為分類屬性。這些值沒有任何顯著的順序。在計算機科學中,這些值也稱為列舉。
二元屬性 - 二元屬性是一個只有兩個元素或狀態的名義屬性,例如 0 或 1,其中 0 通常表示屬性不存在,而 1 表示屬性存在。如果兩個狀態等同於真和假,則二元屬性被定義為布林屬性。
如果二元屬性的兩個狀態同等重要併產生相同的權重,則該二元屬性是對稱的。對哪個結果必須編碼為 0 或 1 沒有偏好。例如,性別屬性具有男性和女性狀態。
如果二元屬性的狀態結果的重要性不同,則該二元屬性是非對稱的,包括艾滋病毒醫學測試的陽性和陰性結果。按照慣例,它可以透過 1(例如,艾滋病毒陽性)對最重要的結果(通常是最接近的結果)進行編碼,並透過 0(例如,艾滋病毒陰性)對不同的結果進行編碼。
有序屬性 - 有序屬性是一個屬性,其可能的值之間具有顯著的順序或等級,但連續值之間的幅度未知。
數值屬性 - 數值屬性是定量的。它是一個可測量的量,以整數或實數值定義。它可以是區間標度或比率標度。
廣告
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP