- 敏捷資料科學教程
- 敏捷資料科學 - 主頁
- 敏捷資料科學 - 簡介
- 方法論概念
- 敏捷資料科學 - 流程
- 敏捷工具和安裝
- 敏捷中的資料處理
- SQL 與 NoSQL
- NoSQL 和資料流程式設計
- 收集和顯示記錄
- 資料視覺化
- 資料豐富
- 使用報告
- 預測的作用
- 用 PySpark 提取特徵
- 構建迴歸模型
- 部署預測系統
- 敏捷資料科學 - SparkML
- 修復預測問題
- 提高預測效能
- 用敏捷和資料科學創造更好的場景
- 敏捷的實現
- 敏捷資料科學的有用資源
- 敏捷資料科學 - 快速指南
- 敏捷資料科學 - 資源
- 敏捷資料科學 - 討論
收集和顯示記錄
本章中,我們將重點關注構成了“敏捷方法”的一部分的 JSON 結構。MongoDB 是一種廣泛使用的 NoSQL 資料結構,可以輕鬆用於收集和顯示記錄。
步驟 1
此步驟涉及建立與 MongoDB 的連線,以便建立集合和指定的資料模型。你只需執行“mongod”命令來啟動連線,並使用 mongo 命令連線到指定的終端。
步驟 2
建立一個新的資料庫,以便以 JSON 格式建立記錄。現在,我們正在建立一個名為“mydb”的虛擬資料庫。
>use mydb
switched to db mydb
>db
mydb
>show dbs
local 0.78125GB
test 0.23012GB
>db.user.insert({"name":"Agile Data Science"})
>show dbs
local 0.78125GB
mydb 0.23012GB
test 0.23012GB
步驟 3
建立集合是獲取記錄列表的必要條件。此功能有利於資料科學研究和輸出。
>use test
switched to db test
>db.createCollection("mycollection")
{ "ok" : 1 }
>show collections
mycollection
system.indexes
>db.createCollection("mycol", { capped : true, autoIndexId : true, size :
6142800, max : 10000 } )
{ "ok" : 1 }
>db.agiledatascience.insert({"name" : "demoname"})
>show collections
mycol
mycollection
system.indexes
demoname
廣告