大資料分析 - 資料科學家



資料科學家的角色通常與預測建模、開發細分演算法、推薦系統、A/B測試框架以及經常處理原始非結構化資料等任務相關聯。

他們工作性質要求對數學、應用統計和程式設計有深刻的理解。資料分析師和資料科學家之間有一些共同的技能,例如查詢資料庫的能力。兩者都分析資料,但資料科學家的決策可能會對組織產生更大的影響。

以下是一套資料科學家通常需要具備的技能:

  • 使用統計軟體包進行程式設計,例如:R、Python、SAS、SPSS或Julia
  • 能夠從不同來源清洗、提取和探索資料
  • 統計模型的研究、設計和實施
  • 深厚的統計學、數學和計算機科學知識

在大資料分析中,人們通常會混淆資料科學家和資料架構師的角色。實際上,區別非常簡單。資料架構師定義資料儲存的工具和架構,而資料科學家則使用此架構。當然,資料科學家如果需要為臨時專案設定新工具,也應該能夠做到,但基礎設施的定義和設計不應成為其任務的一部分。

廣告

© . All rights reserved.