- Apache Pig 教程
- Apache Pig - 首頁
- Apache Pig 簡介
- Apache Pig - 概述
- Apache Pig - 架構
- Apache Pig 環境
- Apache Pig - 安裝
- Apache Pig - 執行
- Apache Pig - Grunt Shell
- Pig Latin
- Pig Latin - 基礎
- 載入與儲存運算子
- Apache Pig - 讀取資料
- Apache Pig - 儲存資料
- 診斷運算子
- Apache Pig - 診斷運算子
- Apache Pig - Describe 運算子
- Apache Pig - Explain 運算子
- Apache Pig - Illustrate 運算子
- Pig Latin 內建函式
- Apache Pig - Eval 函式
- 載入與儲存函式
- Apache Pig - Bag 和 Tuple 函式
- Apache Pig - 字串函式
- Apache Pig - 日期時間函式
- Apache Pig - 數學函式
- Apache Pig 有用資源
- Apache Pig - 快速指南
- Apache Pig - 有用資源
- Apache Pig - 討論
Apache Pig 教程
Apache Pig 是 MapReduce 之上的一個抽象層。它是一個用於分析大型資料集的工具/平臺,將資料集表示為資料流。Pig 通常與Hadoop一起使用;我們可以使用 Pig 在 Hadoop 中執行所有資料操作。
目標讀者
本教程面向所有在 Hadoop 上工作的專業人士,他們希望執行 MapReduce 操作,而無需在 Java 中編寫複雜的程式碼。
前提條件
為了充分利用本教程,您應該很好地理解 Hadoop 的基礎知識和 HDFS 命令。如果您精通 SQL,那將更有幫助。
廣告