Apache NiFi - 處理器分類



在本章中,我們將討論 Apache NiFi 中的處理器分類。

資料攝取處理器

資料攝取類別的處理器用於將資料攝取到 NiFi 資料流中。這些通常是 Apache NiFi 中任何資料流的起點。屬於這些類別的一些處理器包括 GetFile、GetHTTP、GetFTP、GetKAFKA 等。

路由和中介處理器

路由和中介處理器用於根據 FlowFile 屬性或內容中的資訊將 FlowFile 路由到不同的處理器或資料流。這些處理器還負責控制 NiFi 資料流。屬於此類別的一些處理器包括 RouteOnAttribute、RouteOnContent、ControlRate、RouteText 等。

資料庫訪問處理器

此資料庫訪問類別的處理器能夠從資料庫中選擇或插入資料,或執行和準備其他 SQL 語句。這些處理器主要使用 Apache NiFi 的資料連線池控制器設定。屬於此類別的一些處理器包括 ExecuteSQL、PutSQL、PutDatabaseRecord、ListDatabaseTables 等。

屬性提取處理器

屬性提取處理器負責在 NiFi 資料流中提取、分析、更改 FlowFile 屬性處理。屬於此類別的一些處理器包括 UpdateAttribute、EvaluateJSONPath、ExtractText、AttributesToJSON 等。

系統互動處理器

系統互動處理器用於在任何作業系統中執行程序或命令。這些處理器還執行多種語言的指令碼以與各種系統互動。屬於此類別的一些處理器包括 ExecuteScript、ExecuteProcess、ExecuteGroovyScript、ExecuteStreamCommand 等。

資料轉換處理器

屬於資料轉換的處理器能夠更改 FlowFile 的內容。這些可以用於完全替換 FlowFile 的資料,通常在使用者必須將 FlowFile 作為 HTTP 主體傳送以呼叫 InvokeHTTP 處理器時使用。屬於此類別的一些處理器包括 ReplaceText、JoltTransformJSON 等。

傳送資料處理器

傳送資料處理器通常是資料流中的最終處理器。這些處理器負責將資料儲存或傳送到目標伺服器。在成功儲存或傳送資料後,這些處理器將 FlowFile 與成功關係一起刪除。屬於此類別的一些處理器包括 PutEmail、PutKafka、PutSFTP、PutFile、PutFTP 等。

拆分和聚合處理器

這些處理器用於拆分和合並 FlowFile 中存在的內容。屬於此類別的一些處理器包括 SplitText、SplitJson、SplitXml、MergeContent、SplitContent 等。

HTTP 處理器

這些處理器處理 HTTP 和 HTTPS 呼叫。屬於此類別的一些處理器包括 InvokeHTTP、PostHTTP、ListenHTTP 等。

AWS 處理器

AWS 處理器負責與 Amazon Web Services 系統互動。屬於此類別的一些處理器包括 GetSQS、PutSNS、PutS3Object、FetchS3Object 等。

廣告

© . All rights reserved.