討論 PySpark



Apache Spark 用 Scala 程式語言編寫。為了支援使用 Python 編寫 Spark,Apache Spark 社群釋出了一個工具 PySpark。使用 PySpark,您還可以在 Python 程式語言中處理 RDD。這是因為叫做 Py4j 的庫,它能夠實現這一功能。這是一個介紹性教程,涵蓋了資料驅動文件的基礎知識,並解釋瞭如何處理其各種元件和子元件。

廣告
© . All rights reserved.