
- 敏捷資料科學教程
- 敏捷資料科學 - 首頁
- 敏捷資料科學 - 簡介
- 方法論概念
- 敏捷資料科學 - 流程
- 敏捷工具及安裝
- 敏捷中的資料處理
- SQL 與 NoSQL
- NoSQL & 資料流程式設計
- 收集和顯示記錄
- 資料視覺化
- 資料增強
- 使用報表
- 預測的作用
- 使用 PySpark 提取特徵
- 構建迴歸模型
- 部署預測系統
- 敏捷資料科學 - SparkML
- 修復預測問題
- 提高預測效能
- 利用敏捷和資料科學創造更好的場景
- 敏捷的實施
- 敏捷資料科學有用資源
- 敏捷資料科學 - 快速指南
- 敏捷資料科學 - 資源
- 敏捷資料科學 - 討論
敏捷工具及安裝
在本章中,我們將學習不同的敏捷工具及其安裝。敏捷方法論的開發棧包括以下元件集:
事件
事件是在發生或記錄時連同其特徵和時間戳一起發生的事件。
事件可以有多種形式,例如伺服器、感測器、金融交易或使用者在我們應用程式中採取的操作。在本完整教程中,我們將使用 JSON 檔案,這將有助於在不同的工具和語言之間進行資料交換。
收集器
收集器是事件聚合器。它們以系統的方式收集事件,以儲存和聚合大量資料,並將它們排隊以供即時工作程式處理。
分散式文件
這些文件包括多節點(多個節點),它們以特定格式儲存文件。在本教程中,我們將重點關注 MongoDB。
Web 應用程式伺服器
Web 應用程式伺服器透過客戶端以 JSON 格式提供資料進行視覺化,且開銷最小。這意味著 Web 應用程式伺服器有助於測試和部署使用敏捷方法論建立的專案。
現代瀏覽器
它使現代瀏覽器或應用程式能夠將資料作為互動式工具呈現給我們的使用者。
本地環境設定
為了管理資料集,我們將重點關注包含用於管理 excel、csv 和更多檔案的工具的 python 的 Anaconda 框架。安裝 Anaconda 框架後,其儀表板如下所示。它也稱為“Anaconda Navigator”:

導航器包含“Jupyter 框架”,這是一個筆記本系統,有助於管理資料集。啟動框架後,它將如以下所示在瀏覽器中託管:

廣告