
- 敏捷資料科學教程
- 敏捷資料科學——主頁
- 敏捷資料科學——簡介
- 方法論概念
- 敏捷資料科學——流程
- 敏捷工具及安裝
- 敏捷中的資料處理
- SQL 與 NoSQL
- NoSQL 和資料流程式設計
- 收集及展示記錄
- 資料視覺化
- 資料豐富
- 操作報告
- 預測的作用
- 使用 PySpark 提取特徵
- 建立迴歸模型
- 部署預測系統
- 敏捷資料科學——SparkML
- 解決預測問題
- 提升預測效能
- 敏捷及資料科學創造更好的場景
- 敏捷的實現
- 敏捷資料科學有用資源
- 敏捷資料科學——快速指南
- 敏捷資料科學——資源
- 敏捷資料科學——討論
部署預測系統
在本示例中,我們將學習如何建立和部署預測模型,該模型用於預測房價,方法是使用 python 指令碼。用於部署預測系統的重要框架包括 Anaconda 和“Jupyter Notebook”。
請按照以下步驟部署預測系統 -
步驟 1 - 實施以下程式碼,將 csv 檔案中的值轉換為關聯的值。
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import mpl_toolkits %matplotlib inline data = pd.read_csv("kc_house_data.csv") data.head()
上述程式碼生成以下輸出 -

步驟 2 - 執行 describe 函式以獲取 csv 檔案屬性中包含的資料型別。
data.describe()

步驟 3 - 我們可以根據我們建立的預測模型的部署來放棄關聯的值。
train1 = data.drop(['id', 'price'],axis=1) train1.head()

步驟 4 - 您可以逐記錄視覺化資料。這些資料可用於資料科學分析和白皮書的輸出。
data.floors.value_counts().plot(kind='bar')

廣告