
- Hadoop 教程
- Hadoop - 首頁
- Hadoop - 大資料概述
- Hadoop - 大資料解決方案
- Hadoop - 簡介
- Hadoop - 環境設定
- Hadoop - HDFS 概述
- Hadoop - HDFS 操作
- Hadoop - 命令參考
- Hadoop - MapReduce
- Hadoop - 流
- Hadoop - 多節點叢集
- Hadoop 有用資源
- Hadoop - 問題和解答
- Hadoop - 快速指南
- Hadoop - 有用資源
Hadoop - HDFS 操作
啟動 HDFS
首先,必須對已配置的 HDFS 檔案系統進行格式化、開啟名稱節點(HDFS 伺服器)並執行以下命令。
$ hadoop namenode -format
對 HDFS 進行格式化後,啟動分散式檔案系統。以下命令將啟動名稱節點以及資料節點作為叢集。
$ start-dfs.sh
列出 HDFS 中的檔案
將資訊載入到伺服器後,我們可以使用 ‘ls’ 在目錄中查詢檔案列表、獲取檔案狀態。以下是 ls 的語法,你可以將它傳遞給目錄或檔名作為引數。
$ $HADOOP_HOME/bin/hadoop fs -ls <args>
將資料插入 HDFS
假設我們在本地系統中有一個名為 file.txt 的檔案中儲存的資料必須儲存在 hdfs 檔案系統中。按照以下步驟將必需的檔案插入 Hadoop 檔案系統中。
步驟 1
必須建立一個輸入目錄。
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input
步驟 2
使用 put 命令將資料檔案從本地系統傳輸並存儲在 Hadoop 檔案系統中。
$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input
步驟 3
可以使用 ls 命令驗證檔案。
$ $HADOOP_HOME/bin/hadoop fs -ls /user/input
從 HDFS 中檢索資料
假設我們在 HDFS 中有一個名為 outfile 的檔案。下面是一個簡單的演示,用於從 Hadoop 檔案系統中檢索所需檔案。
步驟 1
首先,使用 cat 命令從 HDFS 中檢視資料。
$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile
步驟 2
使用 get 命令將檔案從 HDFS 獲取到本地檔案系統中。
$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/
關閉 HDFS
可以使用以下命令關閉 HDFS。
$ stop-dfs.sh
廣告