Apache Pig tutorial

Apache Pig 教程

Apache Pig 是 MapReduce 之上的一個抽象層。它是一個用於分析大型資料集的工具/平臺,將資料集表示為資料流。Pig 通常與Hadoop一起使用;我們可以使用 Pig 在 Hadoop 中執行所有資料操作。

目標讀者

本教程面向所有在 Hadoop 上工作的專業人士,他們希望執行 MapReduce 操作,而無需在 Java 中編寫複雜的程式碼。

前提條件

為了充分利用本教程,您應該很好地理解 Hadoop 的基礎知識和 HDFS 命令。如果您精通 SQL,那將更有幫助。

廣告
© . All rights reserved.