Apache NiFi - 處理器



Apache NiFi 處理器是建立資料流的基本模組。每個處理器都有不同的功能,有助於建立輸出 FlowFile。下圖所示的資料流使用 GetFile 處理器從一個目錄獲取檔案,並使用 PutFile 處理器將其儲存到另一個目錄。

PutFile processor

GetFile

GetFile 處理器用於從特定目錄獲取特定格式的檔案。它還為使用者提供其他選項以更好地控制獲取過程。我們將在下面的屬性部分討論它。

GetFile

GetFile 設定

以下是 GetFile 處理器的不同設定:

名稱

在“名稱”設定中,使用者可以根據專案或更具意義的名稱為處理器定義任何名稱。

啟用

使用者可以使用此設定啟用或停用處理器。

懲罰持續時間

此設定允許使用者在 FlowFile 失敗時新增懲罰時間。

產量持續時間

此設定用於指定處理器的產量時間。在此期間,不會再次排程該過程。

公告級別

此設定用於指定該處理器的日誌級別。

自動終止關係

此設定列出了該特定程序的所有可用關係的複選框。透過選中複選框,使用者可以對處理器進行程式設計,以便在該事件發生時終止 FlowFile,並且不將其進一步傳送到流中。

Automatically Terminate Relationships

GetFile 排程

以下是 GetFile 處理器提供的排程選項:

排程策略

您可以透過選擇“時間驅動”來按時間安排程序,或者透過選擇“CRON 驅動”選項來選擇指定的 CRON 字串。

併發任務

此選項用於定義此處理器的併發任務排程。

執行

使用者可以使用此選項定義是讓處理器在所有節點上執行還是僅在主節點上執行。

執行計劃

它用於為時間驅動策略定義時間或為 CRON 驅動策略定義 CRON 表示式。

Run Schedule

GetFile 屬性

GetFile 提供多個屬性,如下圖所示,包括必填屬性(如輸入目錄和檔案過濾器)和可選屬性(如路徑過濾器和最大檔案大小)。使用者可以使用這些屬性來管理檔案獲取過程。

GetFile Properties

GetFile 註釋

此部分用於指定有關處理器的任何資訊。

GetFile Comments

PutFile

PutFile 處理器用於將檔案從資料流儲存到特定位置。

PutFile

PutFile 設定

PutFile 處理器具有以下設定:

名稱

在“名稱”設定中,使用者可以根據專案或更具意義的名稱為處理器定義任何名稱。

啟用

使用者可以使用此設定啟用或停用處理器。

懲罰持續時間

此設定允許使用者在 FlowFile 失敗時新增懲罰時間。

產量持續時間

此設定用於指定處理器的產量時間。在此期間,該過程不會再次被排程。

公告級別

此設定用於指定該處理器的日誌級別。

自動終止關係

此設定列出了該特定程序的所有可用關係的複選框。透過選中複選框,使用者可以對處理器進行程式設計,以便在該事件發生時終止 FlowFile,並且不將其進一步傳送到流中。

Automatically Terminate

PutFile 排程

以下是 PutFile 處理器提供的排程選項:

排程策略

您可以透過選擇“時間驅動”來按時間安排程序,或者透過選擇“CRON 驅動”選項來選擇指定的 CRON 字串。還有一個實驗性策略“事件驅動”,它將在特定事件發生時觸發處理器。

併發任務

此選項用於定義此處理器的併發任務排程。

執行

使用者可以使用此選項定義是讓處理器在所有節點上執行還是僅在主節點上執行。

執行計劃

它用於為時間驅動策略定義時間或為 CRON 驅動策略定義 CRON 表示式。

Putfile Run Schedule

PutFile 屬性

PutFile 處理器提供諸如“目錄”之類的屬性,用於指定檔案傳輸的輸出目錄以及其他管理傳輸的屬性,如下圖所示。

PutFile Properties

PutFile 註釋

此部分用於指定有關處理器的任何資訊。

Putfile Comments
廣告
© . All rights reserved.