
- 敏捷資料科學教程
- 敏捷資料科學 - 首頁
- 敏捷資料科學 - 簡介
- 方法論概念
- 敏捷資料科學 - 流程
- 敏捷工具與安裝
- 敏捷中的資料處理
- SQL 與 NoSQL
- NoSQL 與資料流程式設計
- 收集和顯示記錄
- 資料視覺化
- 資料豐富
- 使用報表
- 預測的作用
- 使用 PySpark 提取特徵
- 構建迴歸模型
- 部署預測系統
- 敏捷資料科學 - SparkML
- 修復預測問題
- 提高預測效能
- 透過敏捷和資料科學創造更好的場景
- 敏捷的實施
- 敏捷資料科學有用資源
- 敏捷資料科學 - 快速指南
- 敏捷資料科學 - 資源
- 敏捷資料科學 - 討論
敏捷資料科學 - SQL 與 NoSQL
本教程的完整重點是遵循敏捷方法,減少步驟,並實施更多有用的工具。要理解這一點,瞭解 SQL 和 NoSQL 資料庫之間的區別非常重要。
大多數使用者都瞭解 SQL 資料庫,並且對 MySQL、Oracle 或其他 SQL 資料庫有很好的瞭解。在過去的幾年裡,NoSQL 資料庫已被廣泛採用,以解決各種業務問題和專案需求。

下表顯示了 SQL 和 NoSQL 資料庫之間的區別:
SQL | NoSQL |
---|---|
SQL 資料庫主要被稱為關係資料庫管理系統 (RDBMS)。 | NoSQL 資料庫也稱為面向文件的資料庫。它是非關係型和分散式的。 |
基於 SQL 的資料庫包含具有行和列的表結構。表的集合和其他模式結構稱為資料庫。 | NoSQL 資料庫包含文件作為主要結構,文件的集合稱為集合。 |
SQL 資料庫包含預定義的模式。 | NoSQL 資料庫具有動態資料,幷包含非結構化資料。 |
SQL 資料庫是垂直可擴充套件的。 | NoSQL 資料庫是水平可擴充套件的。 |
SQL 資料庫非常適合複雜的查詢環境。 | NoSQL 沒有用於複雜查詢開發的標準介面。 |
SQL 資料庫不適用於分層資料儲存。 | NoSQL 資料庫更適合分層資料儲存。 |
SQL 資料庫最適合指定應用程式中的大量事務。 | NoSQL 資料庫在複雜事務應用程式的高負載下仍不被認為具有可比性。 |
SQL 資料庫提供其供應商的出色支援。 | NoSQL 資料庫仍然依賴於社群支援。只有少數專家可用於設定和部署大規模 NoSQL 部署。 |
SQL 資料庫側重於 ACID 屬性 - 原子性、一致性、隔離性和永續性。 | NoSQL 資料庫側重於 CAP 屬性 - 一致性、可用性和分割槽容錯性。 |
SQL 資料庫可以根據選擇它們的供應商分類為開源或閉源。 | NoSQL 資料庫根據儲存型別進行分類。NoSQL 資料庫預設是開源的。 |
為什麼敏捷選擇 NoSQL?
上述比較表明,NoSQL 文件資料庫完全支援敏捷開發。它是無模式的,並且不完全專注於資料建模。相反,NoSQL 推遲了應用程式和服務,因此開發人員可以更好地瞭解如何對資料進行建模。NoSQL 將資料模型定義為應用程式模型。

MongoDB 安裝
在本教程中,我們將更多地關注 MongoDB 的示例,因為它被認為是最好的“NoSQL 模式”。




廣告