Hive - 檢視和索引

本章介紹如何建立和管理檢視。檢視是根據使用者需求生成的。您可以將任何結果集資料儲存為檢視。Hive 中檢視的使用與 SQL 中檢視的使用相同。這是一個標準的 RDBMS 概念。我們可以在檢視上執行所有 DML 操作。

建立檢視

您可以在執行 SELECT 語句時建立檢視。語法如下：

CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
[COMMENT table_comment]
AS SELECT ...

示例

讓我們以檢視為例。假設員工表如下所示，欄位包括 Id、Name、Salary、Designation 和 Dept。生成一個查詢，檢索薪資超過 30000 盧比的員工詳細資訊。我們將結果儲存在名為 **emp_30000** 的檢視中。

+------+--------------+-------------+-------------------+--------+
| ID   | Name         | Salary      | Designation       | Dept   |
+------+--------------+-------------+-------------------+--------+
|1201  | Gopal        | 45000       | Technical manager | TP     |
|1202  | Manisha      | 45000       | Proofreader       | PR     |
|1203  | Masthanvali  | 40000       | Technical writer  | TP     |
|1204  | Krian        | 40000       | Hr Admin          | HR     |
|1205  | Kranthi      | 30000       | Op Admin          | Admin  |
+------+--------------+-------------+-------------------+--------+

以下查詢使用上述場景檢索員工詳細資訊：

hive> CREATE VIEW emp_30000 AS
SELECT * FROM employee
WHERE salary>30000;

刪除檢視

使用以下語法刪除檢視：

DROP VIEW view_name

以下查詢刪除名為 emp_30000 的檢視：

hive> DROP VIEW emp_30000;

建立索引

索引只不過是指向表中特定列的指標。建立索引意味著在表的特定列上建立指標。其語法如下：

CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)]
[
   [ ROW FORMAT ...] STORED AS ...
   | STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]

示例

讓我們以索引為例。使用我們之前使用過的相同的員工表，欄位包括 Id、Name、Salary、Designation 和 Dept。在員工表的 salary 列上建立一個名為 index_salary 的索引。

以下查詢建立索引：

hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';

它是指向 salary 列的指標。如果列被修改，則使用索引值儲存更改。

刪除索引

以下語法用於刪除索引：

DROP INDEX <index_name> ON <table_name>

以下查詢刪除名為 index_salary 的索引：

hive> DROP INDEX index_salary ON employee;

列印頁面