資料工程 - 資料儲存
數字資訊分為兩種型別:輸入資料和輸出資料。使用者提供輸入資料,而計算機生成輸出資料。CPU 需要使用者輸入才能執行計算併產生輸出。
過去,使用者必須手動將資料輸入計算機,這既費時又低效。為了解決這個問題,隨機存取儲存器 (RAM) 被用作短期解決方案。RAM 的儲存容量和資料保持時間有限。只讀儲存器 (ROM) 只能讀取和編輯資料,用於控制計算機的基本功能。
儘管隨著動態隨機存取儲存器 (DRAM) 和同步動態隨機存取儲存器 (SDRAM) 的發展,計算機儲存技術取得了進步,但這些技術仍然受到成本、空間和記憶體保持時間的限制。當計算機斷電時,RAM 會丟失資料。
有了資料儲存,使用者可以將資料儲存到裝置上,確保即使計算機斷電也能保留資料。使用者無需手動輸入資料,而是可以指示計算機從儲存裝置檢索資訊。計算機可以讀取來自各種來源的資料,並將其儲存到相同或不同的儲存位置。此外,使用者還可以與他人共享資料。
關係資料庫
關係資料庫是組織資料成預定義關係的資訊集合。資料儲存在一個或多個表中,表具有行和列,這使得很容易理解不同的資料結構之間是如何相互關聯的。關係是表之間的邏輯連線,基於它們之間的互動建立。
這是一個小型企業可能用來處理產品訂單的兩個表的簡單示例。第一個表是客戶資訊表,其中每條記錄都包含客戶姓名、賬單資訊、地址、電話號碼和其他聯絡方式。每條資訊都在自己的一列中,資料庫為每一行分配一個唯一的 ID。在第二個表(客戶訂單表)中,每條記錄都包含下訂單的客戶的 ID、訂購的產品、數量、選擇的尺寸和顏色等——但不包含客戶姓名或聯絡資訊。
關係模型將邏輯資料結構與物理儲存結構分離。這允許資料庫管理員管理物理儲存而不影響資料訪問。
分離也適用於資料庫操作。邏輯操作指定內容,而物理操作確定如何訪問和檢索資料。
為了維護資料的準確性和可訪問性,關係資料庫遵循完整性規則。例如,一條規則可以防止表中出現重複行,以避免資料不一致。
NoSQL 資料庫
NoSQL 資料庫旨在處理大量非結構化和半結構化資料。與具有預定義模式的傳統關係資料庫不同,NoSQL 資料庫使用靈活的資料模型,可以適應變化並水平擴充套件以管理不斷增長的資料量。這分為四大類:
鍵值儲存
列族儲存
圖資料庫
文件資料庫
NoSQL 資料庫通常用於處理大量資料的應用程式,例如社交媒體、遊戲和電子商務,在這些應用程式中,即時處理和分析很困難。它們也用於其他應用程式,例如內容管理系統和文件管理。