Sqoop 模擬測試



本節為您提供各種與Sqoop相關的模擬測試。您可以將這些模擬測試樣本下載到本地機器,並在方便時離線解答。每個模擬測試都附帶一個答案,以便您驗證最終分數並進行自我評分。

問答

Sqoop 模擬測試一

題1 - Sqoop 使用什麼來建立與企業資料倉庫的連線?

A - RDBMS 驅動程式

B - JDBC 驅動程式

C - IDBC 驅動程式

D - SQL 驅動程式

答案:B

解釋

JDBC 驅動程式是一個 Java 程式,傳統上它為各種資料庫提供資料庫連線。

題2 - 除了 JDBC 驅動程式,Sqoop 還需要什麼來連線遠端資料庫?

A - Putty

B - SSH

C - 聯結器

D - Sqoop 客戶端

答案:C

解釋

Sqoop 需要 JDBC 驅動程式和資料庫聯結器,這是匯入資料所必需的。

答案:A

解釋

在一個節點上安裝後,它會自動複製到叢集中的其他節點。

題4 - 預設情況下,Sqoop 匯入到 HDFS 的資料庫記錄是

A - 製表符分隔

B - 列連線

C - 空格分隔

D - 逗號分隔

答案:D

解釋

預設記錄分隔符是逗號。

答案:B

解釋

MapReduce 作業執行多個 Mapper,每個 Mapper 檢索表資料的一部分。

題6 - Sqoop 中指定匯入資料時輸出目錄的引數是

A - --output-path

B - --target-path

C - --output-dir

D - --target-dir

答案:D

解釋

--target-dir 和 --warehouse-dir 是用於指定匯入位置的兩個引數。

答案:B

解釋

為防止意外刪除資料,作業會失敗。

題8 - 為防止在 Sqoop 匯入語句中提及密碼,可以使用哪些附加引數?

A - -p

B - --password-file

C - 兩者都是

D - 無法阻止

答案:C

解釋

-P 選項會提示輸入密碼,而不會顯示回顯,--password-file 選項會讀取儲存在其他檔案中密碼值。

題9 - Sqoop 支援的兩種二進位制檔案格式是什麼?

A - Avro & SequenceFile

B - RCFile 和 SequenceFile

C - ORC 檔案和 RC 檔案

D - Avro 和 RC 檔案

答案:A

解釋

這是 Sqoop 支援的兩種二進位制檔案格式。

題10 - SequenceFile 將每條記錄儲存為鍵值對,而 Avro 系統將記錄儲存為

A - 簡單文字

B - 鏈式列表

C - 連結串列

D - 模式和資料

答案:D

解釋

Sqoop 在讀取資料時會自動生成模式,並將模式詳細資訊與每個生成的 Avro 檔案中的資料一起儲存。

答案:B

解釋

Sqoop 沒有內建程式碼來執行檔案壓縮。它依賴於 Hadoop 的壓縮設定。

題12 - 對於某些資料庫,Sqoop 可以透過使用以下引數來實現更快的 資料傳輸

A - --bulkload

B - --fastload

C - --dump

D - --direct

答案:D

解釋

直接模式將資料傳輸功能委託給資料庫提供的原生實用程式。

題13 - 可以透過使用哪個引數來覆蓋資料庫列和 Sqoop 列之間的資料型別對映?

A - --override-column-type

B - --map-column-type

C - --override-column-java

D - --map-column-java

答案:D

解釋

由於 Sqoop 在內部使用 Java 資料型別,因此必須使用 Java 資料型別進行資料型別的對映。

答案:B

解釋

Sqoop 使用的預設 Map 任務數為 4。

這可以使用 num-mappers 引數進行更改。

題15 - 從 CSV 檔案匯入時,Sqoop 遇到缺失值時使用的預設值是什麼?

A - NULL

B - null

C - 空格字元

D - 無值

答案:B

解釋

與資料庫不同,CSV 檔案中沒有 NULL 值。Sqoop 使用 null 字串來處理這些值。

題16 - 使用 Sqoop 可以使用什麼選項從關係系統匯入整個資料庫?

A - --import-all-db

B - --import-all-tables

C - --import-all

D - --import

答案:C

解釋

--import-all-tables 用於從資料庫匯入所有表。表的結構以及資料都是透過此命令逐一匯入的。

題17 - 使用 --import-all-tables 引數時,可以使用什麼選項僅匯入資料庫中的某些表?

A - --skip-tables

B - --without-tables

C - --forgo-tables

D - --exclude-tables

答案:D

解釋

您可以將表名與 --exclude-table 子句一起使用,以便在匯入整個資料庫時跳過給定數量的表。

答案:C

解釋

您可以從表中進行完整和部分資料匯入,但不能從表中匯入列的子集。

題19 - Sqoop 中匯入資料的兩種不同的增量模式是什麼?

A - 合併和新增

B - 追加和修改

C - 合併和上次修改

D - 追加和上次修改

答案:D

解釋

--incremental 引數用於僅獲取新資料(Hadoop 中尚不存在的資料)。如果指定了要檢查新資料的列,則將其作為追加操作執行。它還可以使用 last modified 引數,該引數將使用現有表中的 last_updated_date 列來標識新行。

答案:C

解釋

Sqoop 在追加模式和 last_update_date 模式中都使用 --last-value 引數從源匯入增量資料。

答案:D

解釋

那些不會經常變化的命令列選項(引數的名稱和值)可以儲存到檔案中,反覆使用。這被稱為選項檔案。

Q 22 - 在 Sqoop import 命令中指定連線字串時,對於 Hadoop 叢集,如果我們在 URI 中使用 localhost 來代替伺服器地址(主機名或 IP 地址),那麼

A - import 作業將連線到本地資料庫

B - 每個節點可能會連線到不同的資料庫

C - import 作業可能會成功

D - 以上所有

答案:D

解釋

指定 localhost 並不會使命令無效,因為某些本地資料庫可能正在執行,並且節點將能夠連線。因此,如果可用,每個節點將連線到不同的資料庫。

Q 23 - 與儲存在密碼檔案中相比,將密碼儲存在元儲存庫中的缺點是什麼?

A - 它很容易訪問

B - 它可能意外被刪除

C - 它無法更新

D - 它未加密

答案:D

解釋

密碼檔案可以加密,並透過適當的許可權防止讀取。但元儲存庫未加密,無法防止讀取。

答案:A

解釋

使用元儲存庫的主要優點是,任何擁有環境訪問許可權的使用者都可以使用它,而無需知道密碼。

Q 25 - 使用哪個選項可以在執行時更改儲存的 Sqoop 作業中的引數?

A - --alter

B - --newval

C - --exec

D - --changeparam

答案:C

解釋

對於名為“job1”的儲存作業,可以使用以下命令在執行時更改 --table 引數。

sqoop job --exec job1 -- --table newtable。

答案表

題號 答案
1 B
2 C
3 A
4 D
5 B
6 D
7 B
8 C
9 A
10 D
11 B
12 D
13 D
14 B
15 B
16 C
17 D
18 C
19 D
20 C
21 D
22 D
23 D
24 A
25 C
sqoop_questions_answers.htm
廣告