分類資料
介紹
分類資料是指將資料劃分為不同類別的資料。由分類變數(已劃分為類別的變數)組成的統計資訊稱為分類資料。例如,一組分組資料。更具體地說,可數的定性資料或在預定區間內聚集的定量資料可用於建立分類資料。
資訊被濃縮成一個機率表。但是,當我們檢查資料分析時,它被稱為使用短語“分類資料”,它用於資料集。需要注意的是,儘管資料集包含一些分類變數,但它也可能包含非分類變數。
在本教程中,我們將討論分類資料。
定義
分類資料由分類變數組成,分類變數代表特徵,例如一個人的性別或家鄉。分類測量以自然語言描述表示,而不是以數字表示。
分類資料有時可能具有數值,但這些值在數學上沒有意義。
以下是分類資料的一些示例:最喜歡的運動、學校郵政編碼等。
型別
通常,分類資料由可以分類或分組的值和觀察結果組成。餅圖和條形圖是這些資料的理想視覺表示。此外,分類資訊分為兩類 -
順序資料和名義資料
名義資料
“名義”一詞源於拉丁語“Nomen”,意為名稱。
因此,“命名”或“標記”資料(忽略資料的數值)是一種名義分類資料。
名義資料不可測量或排列。但是,名義資料有時可以是定性和定量的。一些常用的名義資料示例包括字母、單詞、符號、性別等。
分組方法用於分析這些資料。當變數被分組時,可以確定百分比或頻率。可以使用餅圖來直觀地呈現它。
順序資料
順序分類資料根據一定的“尺度”或“度量”進行分類。
尺度不一定總是精確或統一的。
通常,此類資料會被測量或排序。
由於存在數值,因此這種特殊的分類資料被認為具有分類和數值資料特徵。
可以透過分組來檢查它們,並且可以使用條形圖來直觀地說明它們。
示例包括使用數值比較類別變數下分組資料的調查。
分類變數
分類變數是在分組分類資料以不同名稱或標籤呈現時接受多個值的變數。
分類資料的基本特徵是分類變數。
示例:各種顏色陰影、高階品牌、一個人的血型等是分類變數的示例。
分類資料與數值資料
分類資料
可以分類或歸類為不同類別的資料稱為分類資料或定性資料,例如狗的型別、汽車的顏色等。
因為它在分類之前驗證資料,所以它也被稱為定性資料。
調查可能會很長,這可能會讓受訪者望而卻步。
數值資料
數值或定量資料,使用數字或數值來表示資訊,例如一個人的身高、體重、年齡等。
因為它表示定量值,以便可以對它們應用算術運算,所以有時被稱為定量資料。
由於參與度快速且簡單,因此調查放棄的顧慮較少。
已解決示例
1) 以下哪一個是合適的分類變數?
年齡
數字對的乘積
顏色
無
分類變數是年齡和顏色。
2) 年齡是名義還是順序分類變數?
根據上下文,年齡既可以是名義的,也可以是順序的。
當年齡用於表示特定順序時,它屬於順序分類資料。
作為名義分類資料“命名”或“標記”的資料不考慮資料的數值。
年齡是一個名義分類變數,它是一個基於數值資料順序的不可比較的特徵。
3) 說明以下陳述是真還是假?
根據它們在資料中的應用,一些分類變數可以是名義的,也可以是順序的。
給定的陳述是正確的。
4) 以下列表中哪些是分類資料的示例?
六名學生的年齡資訊。
五人的頭髮顏色。
七名學生選擇的年度旅行地點。
博物館在每週不同日期的訪客數量。
C 是最佳選擇。七名學生選擇的年度旅行地點。
分類資料指的是可以劃分為多個組的非數值資訊。
5) 順序分類資料和名義分類資料有什麼區別?
順序分類資料 -
它是一組有序的非引數資料。
根據它們的數值資料,值被分類為順序的。
順序分類資料用於對人們的想法或意見進行分析或調查。
例如,學生在考試中的不同排名以及調查中受訪者的意見。
名義分類資料 -
它是一組無序的非引數資料。
值的“名稱”或“標籤”決定它們是否被認為是名義的。
使用名義分類資料將相似的物件歸為一類。
例如,頭髮顏色、性別、國家和種族。
結論
分類資料由分類變數組成,分類變數代表特徵,例如一個人的性別或家鄉。分類測量以自然語言描述表示,而不是以數字表示。
分類資料有時可能具有數值,但這些值在數學上沒有意義。
常見問題
1. 分類資料是什麼意思?
由分類變數(已劃分為類別的變數)組成的統計資訊稱為分類資料。
2. 名義資料是什麼意思?
名義資料是一種資料型別,它不為變數分配任何數值。也稱為名義尺度。
3. 什麼是順序資料?
順序資料是指具有自然順序的資料。順序資料的顯著特徵包括無法區分資料值。
4. 數字可以被歸類為資料嗎?
數字可以用作分類資料。分類資料可以包括分組以及反映它們的某些常見標籤和數字的數值分析。
5. 數值資料是什麼意思?
數值或定量資料,使用數字或數值來表示資訊,例如一個人的身高、體重、年齡等。