資料科學 - 科學家



資料科學家是經過培訓的專業人士,負責分析和解讀資料。他們利用其資料科學知識幫助企業做出更明智的決策並提高運營效率。大多數資料科學家都擁有豐富的數學、統計學和計算機科學經驗。他們利用這些知識來研究大型資料集,並發現趨勢或模式。資料科學家也可能提出收集和儲存資料的新方法。

如何成為一名資料科學家?

目前,企業對能夠利用資料分析為其提供競爭優勢的人才需求旺盛。作為一名資料科學家,您將基於資料建立業務解決方案和分析。

成為資料科學家的途徑有很多,但由於這通常是一個高階職位,因此大多數資料科學家都擁有數學、統計學、計算機科學和其他相關領域的學位。

以下是一些成為資料科學家的步驟:

步驟 1 - 掌握資料技能

即使您沒有資料相關的工作經驗,也可以成為一名資料科學家,但您需要獲得從事資料科學職業所需的必要基礎知識。

資料科學家是一個高階職位;在達到這一專業水平之前,您應該在一個相關領域建立一個全面的知識基礎。這可能包括數學、工程學、統計學、資料分析、程式設計或資訊科技;一些資料科學家是從銀行或棒球球探開始職業生涯的。

但無論您從哪個領域開始,都應該從 Python、SQL 和 Excel 開始。這些技能對於處理和組織原始資料至關重要。熟悉 Tableau 也很有益,這是一個您將經常用於建立視覺化效果的工具。

步驟 2 - 學習資料科學基礎知識

參加資料科學訓練營可能是學習或提高資料科學原理的理想方法。您可以參考資料科學訓練營,其中詳細介紹了每個主題。

學習資料科學基礎知識,例如如何收集和儲存資料、分析和建模資料以及使用資料科學領域中的所有工具(例如 Tableau 和 PowerBI 等)來顯示和呈現資料。

在培訓結束時,您應該能夠使用 Python 和 R 建立評估行為和預測未知因素的模型,以及以使用者友好的格式重新打包資料。

一些資料科學職位列表將高階學位列為先決條件。有時,這是不可協商的,但當需求超過供應時,這一點越來越揭示了真相。也就是說,必要的技能證明往往勝過單純的資格證書。

招聘經理最關心的是您能否證明自己掌握了該主題,並且越來越多的人意識到,這並不一定需要透過傳統的方式來實現。

資料科學基礎知識

  • 收集和儲存資料。

  • 分析和建模資料。

  • 構建一個可以使用給定資料進行預測的模型。

  • 以使用者友好的形式視覺化和呈現資料。

步驟 3 - 學習資料科學的關鍵程式語言

資料科學家使用各種專門用於清理、分析和建模資料的工具和程式。資料科學家需要掌握的不僅僅是 Excel。他們還需要了解像 Python、R 或 Hive 這樣的統計程式語言,以及像 SQL 這樣的查詢語言。

RStudio Server 是資料科學家最重要的工具之一,它提供了一個用於在伺服器上使用 R 進行開發的環境。另一個流行的軟體是開源的 Jupyter Notebook,它可以用於統計建模、資料視覺化、機器學習等等。

機器學習在資料科學中得到了最廣泛的應用。它指的是利用人工智慧賦予系統學習和改進的能力,而無需對其進行專門程式設計。

步驟 4 - 學習如何進行視覺化並進行練習

使用 Tableau、PowerBI、Bokeh、Plotly 或 Infogram 等程式練習從頭開始建立自己的視覺化效果。找到最佳方法讓資料自己“說話”。

Excel 通常用於此步驟。即使電子表格的基本概念很簡單——透過關聯單元格中的資訊進行計算或繪圖——但 Excel 在 30 多年後的今天仍然非常有用,並且幾乎不可能在沒有它的情況下進行資料科學。

但是,建立漂亮的圖片僅僅是開始。作為一名資料科學家,您還需要能夠使用這些視覺化效果向現場觀眾展示您的發現。您可能已經具備了這些溝通技巧,但如果沒有,也不要擔心。任何人都可以透過練習變得更好。如果需要,可以從小做起,先向一個朋友甚至您的寵物進行演示,然後再擴充套件到一個群體。

步驟 5 - 從事一些資料科學專案來提升您的實踐資料技能

一旦您瞭解了資料科學家使用的程式語言和數字工具的基礎知識,就可以開始使用它們來練習和提高您的新技能。嘗試承擔需要廣泛技能的專案,例如使用 Excel 和 SQL 來管理和查詢資料庫,以及使用 Python 和 R 來使用統計方法分析資料,構建分析行為並提供新見解的模型,以及使用統計分析來預測未知的事物。

在練習過程中,嘗試涵蓋流程的不同部分。從研究一家公司或市場領域開始,然後定義並收集適合當前任務的資料。最後,清理和測試這些資料,使其儘可能有用。

最後,您可以建立和使用自己的演算法來分析和建模資料。然後,您可以將結果放入易於閱讀的視覺化效果或儀表板中,使用者可以使用這些視覺化效果與您的資料互動並提出相關問題。您甚至可以嘗試向其他人展示您的發現,以提高溝通能力。

您還應該習慣於處理不同型別的資料,例如文字、結構化資料、影像、音訊甚至影片。每個行業都有自己型別的資料,可以幫助領導者做出更好、更明智的決策。

作為一名工作中的資料科學家,您可能會在一個或兩個領域成為專家,但作為一名正在構建技能的初學者,您需要學習儘可能多的型別的基礎知識。

承擔更復雜的專案將使您有機會了解資料可以如何以不同的方式使用。一旦您瞭解瞭如何使用描述性分析來查詢資料中的模式,您將更有準備地嘗試更復雜的統計方法,例如資料探勘、預測建模和機器學習,以預測未來事件甚至提出建議。

步驟 6 - 建立展示您資料科學技能的作品集

完成初步研究、獲得培訓並透過建立一系列令人印象深刻的專案來練習新技能後,下一步就是透過建立經過精心打磨的作品集來展示您的新技能,從而獲得您夢寐以求的工作。

事實上,在求職過程中,您的作品集可能是您最重要的資產。如果您想成為一名資料科學家,您可能希望在 GitHub 上(或者除了您自己的網站之外)展示您的作品。GitHub 使您能夠輕鬆展示您的工作、流程和結果,同時在公共網路中提升您的個人形象。但這還不是全部。

將引人入勝的故事與您的資料結合起來,並展示您試圖解決的問題,以便僱主能夠了解您的能力。您可以更全面地在 GitHub 上展示您的程式碼,而不僅僅是單獨列出它,這使得您的貢獻更容易理解。

在申請特定職位時,不要列出您所有的工作。重點突出一些與您申請的職位最相關的作品,並最佳地展示您在整個資料科學流程中的技能範圍,從開始使用基本資料集到定義問題、清理、構建模型和找到解決方案。

您的作品集是您展示自己不僅僅能夠處理數字和進行良好溝通的機會。

步驟 7 - 展示您的能力

您獨立完成的一個精心製作的專案可以成為展示您的技能並給可能聘用您的招聘經理留下深刻印象的好方法。

選擇一個您真正感興趣的東西,提出一個關於它的問題,並嘗試用資料來回答這個問題。

記錄您的旅程,並透過以一種美觀的方式呈現您的發現並解釋您是如何獲得這些發現的,來展示您的技術技能和創造力。您的資料應伴隨著引人入勝的故事,展示您解決的問題,突出您的流程和採取的創造性步驟,以便僱主能夠看到您的價值。

加入 Kaggle 等線上資料科學網路是另一種證明您參與社群、展示您作為有抱負的資料科學家的技能以及繼續提升您的專業知識和影響力的絕佳方式。

步驟 8 - 開始申請資料科學職位

資料科學領域有很多工作機會。在學習基礎知識之後,人們通常會繼續專注於不同的子領域,例如資料工程師、資料分析師或機器學習工程師等等。

瞭解一家公司重視什麼以及他們在做什麼,並確保它符合您的技能、目標和未來的職業規劃。並且不要只關注矽谷。像波士頓、芝加哥和紐約這樣的城市也面臨著技術人才短缺的問題,因此有很多機會。

廣告

© . All rights reserved.