找到 163 篇文章,關於資料科學

使用 purrr 進行函數語言程式設計

Bhuwanesh Nainwal
更新於 2023年1月17日 16:18:23

254 次瀏覽

函數語言程式設計是一種程式設計方法,我們透過構造和應用函式來構造程式。更具體地說,在程式中,我們應用的是順序的純函式而不是語句。純函式是一個接受輸入併產生一致輸出值的函式。此外,在這個過程中不會修改任何增強或輸入流。此類函式能夠執行單個操作,但為了執行復雜操作,我們可以將它們組合成序列。在本教程中,我們將討論使用 purr 進行函數語言程式設計。如今,函數語言程式設計因其能夠…… 閱讀更多

防禦性 R 程式設計

Bhuwanesh Nainwal
更新於 2023年1月17日 14:54:01

338 次瀏覽

防禦性程式設計是一種軟體開發實踐,它涉及以一種能夠預測和防止錯誤和漏洞的方式來設計和實現程式碼。在 R 程式設計中,防禦性程式設計包括使用技術和策略來確保您的 R 程式碼健壯、可靠和安全。“防禦性”一詞可能會讓大多數人感到困惑,即它是否意味著編寫絕不會失敗的程式碼。但“防禦性程式設計”的實際定義是編寫能夠正確失敗的程式碼。透過“正確失敗”,我們的意思是——如果程式碼失敗,那麼它應該…… 閱讀更多

處理 R 中的缺失資料

Bhuwanesh Nainwal
更新於 2023年1月17日 16:12:22

29K+ 次瀏覽

在資料科學中,處理缺失資料是一項常見任務。如果您的資料集中存在缺失資料,則有多種方法可以在 R 程式設計中處理它。一種方法是簡單地刪除包含缺失資料的任何行或列。處理缺失資料的另一種方法是使用統計方法估算缺失值。這意味著使用基於資料集中其他值的資訊來替換缺失值。例如,我們可以用變數的平均值或中位數來替換缺失值,這些變數中存在缺失值…… 閱讀更多

使用 data.table 在 R 中進行資料操作

Bhuwanesh Nainwal
更新於 2023年1月17日 14:17:38

2K+ 次瀏覽

資料操作是資料分析過程中至關重要的一步,因為它允許我們以適合特定分析或視覺化的方式準備和組織資料。根據資料的型別和結構以及操作的具體目標,存在許多不同的資料操作工具和技術。data.table 包是一個 R 包,它提供 R 中 data.frame 類的增強版本。它的語法和功能使操作和處理大型資料集更容易、更快。data.table 是…… 閱讀更多

Python 中的資料科學入門

Prabhdeep Singh
更新於 2023年1月11日 11:31:06

681 次瀏覽

近幾十年來,隨著世界進入大資料時代,對更有效和更高效的資料儲存的需求大大增加。使用大資料的企業會投入大量時間和精力來建立能夠容納大量資訊的框架。然後,透過建立像 Hadoop 這樣的框架,使得儲存大量資料成為可能。由於可以使用這些框架來解決儲存問題,因此接下來要解決的問題是如何處理已經儲存的資料。處理資料並獲取有用資訊的解決方案…… 閱讀更多

資料科學中的 Git 入門

Prabhdeep Singh
更新於 2023年1月11日 11:20:43

1K+ 次瀏覽

由於資料科學家正在從事生產系統並加入研發團隊,因此資料科學和工程領域越來越多的相互作用。我們希望簡化沒有工程經驗的資料科學家理解核心工程最佳實踐。我們正在編寫一本關於工程主題的指南,例如 Git、Docker、雲基礎設施和模型服務,我們聽到資料科學從業者正在考慮這些問題。Git 入門 Git 是一種版本控制系統,旨在跟蹤對原始碼隨時間推移所做的更改。如果沒有版本控制系統,多個人的協作…… 閱讀更多

使用列表和迭代器的 Python 資料科學

Prabhdeep Singh
更新於 2023年1月11日 11:23:00

214 次瀏覽

資料科學是從大量資料中提取知識和見解的過程,它涉及組織、處理和分析這些資料。它涉及許多不同的領域,包括統計和數學建模、從資料來源中提取資料以及資料視覺化方法。通常需要使用大資料技術來收集結構化和非結構化資料。在接下來的部分中,我們將研究資料科學的幾個應用以及 Python 在這些應用中的用途。Python 是一種廣泛使用的、高階的、通用的、面向物件的解釋型語言。要將 Python 用於一項任務,只需要…… 閱讀更多

Python 資料科學入門

Prabhdeep Singh
更新於 2023年1月11日 11:15:18

242 次瀏覽

Python 是一種通用的、面向物件的、解釋型的高階語言,在市場上非常流行。Python 有一個非常豐富的庫,其中包含幾乎所有用途的預定義程式碼,並且只需使用邏輯即可將 Python 用於一項任務,因為大部分編碼部分由 Python 本身處理。Python 有一個龐大的開發者社群,這為新手和經驗豐富的 Python 使用者帶來了額外的益處,即不會出現任何錯誤。在介紹 Python 資料科學之前,讓我們先了解一下資料科學的一些基礎知識。什麼是資料科學?…… 閱讀更多

Python 中的資料科學家的軟體工程

Prerna Tiwari
更新於 2023年1月9日 16:41:06

234 次瀏覽

資料科學將數學和統計、專業程式設計、高階分析、機器學習和人工智慧 (AI) 與特定主題專業知識相結合,以揭示隱藏在組織資料中的可行見解。資料科學是所有行業中增長速度最快的領域之一。這是由於資料來源和由此產生的資料的數量不斷增加。自從資料科學開始獲得認可以來,它就在其他學科中引發了爭議。在本文中,我們將學習軟體工程的基礎知識,為什麼它…… 閱讀更多

使用 Dask 進行平行計算

Prerna Tiwari
更新於 2023年1月9日 16:08:30

493 次瀏覽

Dask 是一個靈活的開源 Python 庫,用於平行計算。在本文中,我們將學習平行計算以及為什麼我們應該選擇 Dask 來完成此任務。我們將將其與 Spark、Ray 和 Modin 等其他各種庫進行比較。我們還討論了 Dask 的用例。平行計算 平行計算是一種同時執行多個計算或程序的計算型別。大型問題通常會分解成可以單獨解決的小塊。平行計算的四大類是位級、指令級、資料級和作業並行。…… 閱讀更多

廣告
© . All rights reserved.