HCatalog Tutorial

HCatalog 教程

HCatalog 是 Hadoop 的表儲存管理工具,它將 Hive 元儲存的表格資料暴露給其他 Hadoop 應用程式。它允許使用不同資料處理工具(Pig、MapReduce)的使用者輕鬆將資料寫入網格。HCatalog 確保使用者無需擔心資料儲存的位置或格式是什麼。本教程較為簡短,僅介紹 HCatalog 的基礎知識及如何使用它。

受眾

本教程面向希望使用 Hadoop 框架在“大資料分析”領域謀求職業的專業人員。資料抽取、轉換、載入 (ETL) 開發人員和從事分析工作的專業人員也可以有效利用本教程。

先決條件

在繼續本教程之前,你需要掌握 Java 核心知識、SQL 資料庫概念、Hadoop 檔案系統以及任何 Linux 作業系統版本的基本知識。

廣告
© . All rights reserved.