Apache NiFi - 基本概念



Apache NiFi 由一個 Web 伺服器、流控制器和一個處理器組成,這些元件都在 Java 虛擬機器上執行。它還具有 3 個儲存庫:Flowfile 儲存庫、內容儲存庫和溯源儲存庫,如下面的圖所示。

Apache Web Server

Flowfile 儲存庫

此儲存庫儲存每個透過 Apache NiFi 資料流的 Flowfile 的當前狀態和屬性。此儲存庫的預設位置位於 Apache NiFi 的根目錄中。可以透過更改名為“nifi.flowfile.repository.directory”的屬性來更改此儲存庫的位置。

內容儲存庫

此儲存庫包含 NiFi 中所有 Flowfile 中的所有內容。其預設目錄也位於 NiFi 的根目錄中,可以使用“org.apache.nifi.controller.repository.FileSystemRepository”屬性更改它。此目錄使用大量磁碟空間,因此建議在安裝磁碟中有足夠的可用空間。

溯源儲存庫

該儲存庫跟蹤並存儲 NiFi 中所有流經 Flowfile 的所有事件。有兩個溯源儲存庫 - **易失性溯源儲存庫**(在此儲存庫中,所有溯源資料在重新啟動後都會丟失)和**永續性溯源儲存庫**。其預設目錄也位於 NiFi 的根目錄中,可以使用“org.apache.nifi.provenance.PersistentProvenanceRepository”和“org.apache.nifi.provenance.VolatileProvenanceRepositor”屬性分別更改這兩個儲存庫。

Provenance Repository
廣告

© . All rights reserved.