
- SQL 教程
- SQL - 首頁
- SQL - 概述
- SQL - RDBMS 概念
- SQL - 資料庫
- SQL - 語法
- SQL - 資料型別
- SQL - 運算子
- SQL - 表示式
- SQL 資料庫
- SQL - 建立資料庫
- SQL - 刪除資料庫
- SQL - 選擇資料庫
- SQL - 重新命名資料庫
- SQL - 顯示資料庫
- SQL - 備份資料庫
- SQL 表
- SQL - 建立表
- SQL - 顯示錶
- SQL - 重命名錶
- SQL - 截斷表
- SQL - 克隆表
- SQL - 臨時表
- SQL - 修改表
- SQL - 刪除表
- SQL - 刪除表資料
- SQL - 約束
- SQL 查詢
- SQL - 插入查詢
- SQL - 選擇查詢
- SQL - SELECT INTO
- SQL - INSERT INTO SELECT
- SQL - 更新查詢
- SQL - 刪除查詢
- SQL - 排序結果
- SQL 檢視
- SQL - 建立檢視
- SQL - 更新檢視
- SQL - 刪除檢視
- SQL - 重新命名檢視
- SQL 運算子和子句
- SQL - WHERE 子句
- SQL - TOP 子句
- SQL - DISTINCT 子句
- SQL - ORDER BY 子句
- SQL - GROUP BY 子句
- SQL - HAVING 子句
- SQL - AND & OR
- SQL - 布林 (BIT) 運算子
- SQL - LIKE 運算子
- SQL - IN 運算子
- SQL - ANY, ALL 運算子
- SQL - EXISTS 運算子
- SQL - CASE
- SQL - NOT 運算子
- SQL - 不等於
- SQL - IS NULL
- SQL - IS NOT NULL
- SQL - NOT NULL
- SQL - BETWEEN 運算子
- SQL - UNION 運算子
- SQL - UNION vs UNION ALL
- SQL - INTERSECT 運算子
- SQL - EXCEPT 運算子
- SQL - 別名
- SQL 連線
- SQL - 使用連線
- SQL - 內連線
- SQL - 左連線
- SQL - 右連線
- SQL - 交叉連線
- SQL - 全連線
- SQL - 自連線
- SQL - 刪除連線
- SQL - 更新連線
- SQL - 左連線 vs 右連線
- SQL - UNION vs JOIN
- SQL 鍵
- SQL - 唯一鍵
- SQL - 主鍵
- SQL - 外部索引鍵
- SQL - 組合鍵
- SQL - 候選鍵
- SQL 索引
- SQL - 索引
- SQL - 建立索引
- SQL - 刪除索引
- SQL - 顯示索引
- SQL - 唯一索引
- SQL - 聚簇索引
- SQL - 非聚簇索引
- 高階 SQL
- SQL - 萬用字元
- SQL - 註釋
- SQL - 注入
- SQL - 託管
- SQL - MIN & MAX
- SQL - NULL 函式
- SQL - CHECK 約束
- SQL - DEFAULT 約束
- SQL - 儲存過程
- SQL - NULL 值
- SQL - 事務
- SQL - 子查詢
- SQL - 處理重複資料
- SQL - 使用序列
- SQL - 自動遞增
- SQL - 日期 & 時間
- SQL - 遊標
- SQL - 公共表表達式
- SQL - GROUP BY vs ORDER BY
- SQL - IN vs EXISTS
- SQL - 資料庫調優
- SQL 函式參考
- SQL - 日期函式
- SQL - 字串函式
- SQL - 聚合函式
- SQL - 數值函式
- SQL - 文字 & 圖片函式
- SQL - 統計函式
- SQL - 邏輯函式
- SQL - 遊標函式
- SQL - JSON 函式
- SQL - 轉換函式
- SQL - 資料型別函式
- SQL 有用資源
- SQL - 問答
- SQL - 快速指南
- SQL - 有用函式
- SQL - 有用資源
- SQL - 討論
SQL - 處理重複資料
有時,表或結果集包含重複記錄。在大多數情況下,允許重複記錄,但在某些情況下,需要防止重複記錄並將其從資料庫表中刪除。
為什麼在 SQL 中處理重複資料是必要的?
在 SQL 資料庫中處理重複資料是為了防止以下後果:
組織資料庫中重複資料的出現會導致邏輯錯誤。
重複資料佔用儲存空間,導致資料庫使用效率下降。
由於資源使用增加,處理資源的總成本也會上升。
由於重複資料的存在導致邏輯錯誤增加,從資料庫資料分析中得出的結論也會出現錯誤。
本章將介紹如何防止表中出現重複記錄以及如何刪除已存在的重複記錄。
防止重複條目
為了防止重複記錄進入表中,我們可以在相關欄位上定義主鍵或唯一索引。這些資料庫約束確保指定列或列集中每個條目的唯一性。
示例
讓我們使用以下查詢建立一個 CUSTOMERS 表:
CREATE TABLE CUSTOMERS ( FIRST_NAME CHAR(20), LAST_NAME CHAR(20), SEX CHAR(10) );
由於我們沒有在表上定義任何約束,因此可以向其中插入重複記錄。為了防止這種情況,請在相關欄位(例如 LAST_NAME 和 FIRST_NAME 組合)上新增主鍵約束:
ALTER TABLE CUSTOMERS ADD PRIMARY KEY (LAST_NAME, FIRST_NAME);
使用 INSERT IGNORE 查詢
或者,我們可以使用 INSERT IGNORE 語句插入記錄,而不會為重複項生成錯誤,如下所示:
INSERT IGNORE INTO CUSTOMERS (LAST_NAME, FIRST_NAME) VALUES ( 'Jay', 'Thomas'), ( 'Jay', 'Thomas');
如下所示,表中將只包含一條記錄(忽略重複值)。
FIRST_NAME | LAST_NAME | SEX |
---|---|---|
Thomas | Jay | NULL |
使用 REPLACE 查詢
或者,使用 REPLACE 語句替換重複項,如下面的查詢所示:
REPLACE INTO CUSTOMERS (LAST_NAME, FIRST_NAME) VALUES ( 'Ajay', 'Kumar'), ( 'Ajay', 'Kumar');
表將包含以下記錄:
FIRST_NAME | LAST_NAME | SEX |
---|---|---|
Kumar | Ajay | NULL |
Thomas | Jay | NULL |
INSERT IGNORE 和 REPLACE 語句的選擇應根據所需的重複處理行為做出。INSERT IGNORE 語句保留第一組重複記錄並丟棄任何後續重複記錄。相反,REPLACE 語句保留最後一組重複項並擦除任何較早的重複項。
使用 UNIQUE 約束
在表中強制唯一性的另一種方法是新增 UNIQUE 約束而不是 PRIMARY KEY 約束:
CREATE TABLE BUYERS ( FIRST_NAME CHAR(20) NOT NULL, LAST_NAME CHAR(20) NOT NULL, SEX CHAR(10), UNIQUE (LAST_NAME, FIRST_NAME) );
計數和識別重複項
要根據特定列計算和識別重複記錄,我們可以使用 COUNT 函式和 GROUP BY 子句。
示例
以下是計算 BUYERS 中 FIRST_NAME 和 LAST_NAME 重複記錄的查詢:
SELECT COUNT(*) as repetitions, LAST_NAME, FIRST_NAME FROM BUYERS GROUP BY LAST_NAME, FIRST_NAME HAVING repetitions > 1;
此查詢將返回 PERSON_TABLE 表中所有重複記錄的列表。要識別重複的值集,請按照以下步驟操作:
確定哪些列包含可能重複的值。
將這些列列在列選擇列表中,以及 COUNT(*)。
還在 GROUP BY 子句中列出這些列。
新增 HAVING 子句,透過要求組計數大於一來消除唯一值。
從表中消除重複項
我們可以將 DISTINCT 關鍵字與 SELECT 語句一起使用,從表中檢索唯一記錄。
SELECT DISTINCT LAST_NAME, FIRST_NAME FROM BUYERS ORDER BY LAST_NAME;
或者,您可以包含一個 GROUP BY 子句,指定您要選擇的列以消除重複項:
SELECT LAST_NAME, FIRST_NAME FROM BUYERS GROUP BY LAST_NAME, FIRST_NAME;