SAP BODS - 查詢轉換



這是資料服務中最常用的轉換,您可以執行以下功能:

  • 從資料來源過濾資料
  • 連線來自多個數據源的資料
  • 對資料執行函式和轉換
  • 從輸入到輸出模式的列對映
  • 分配主鍵
  • 新增新的列、模式和函式到輸出模式

由於查詢轉換是最常用的轉換,因此工具面板中為此查詢提供了快捷方式。

要新增查詢轉換,請按照以下步驟操作:

步驟 1 - 點選查詢轉換工具面板。點選資料流工作區中的任意位置。將其連線到輸入和輸出。

Connect Inputs Outputs

雙擊查詢轉換圖示時,將開啟一個用於執行查詢操作的查詢編輯器。

查詢轉換中包含以下區域:

  • 輸入模式
  • 輸出模式
  • 引數

輸入和輸出模式包含列、巢狀模式和函式。“模式輸入”和“模式輸出”顯示轉換中當前選擇的模式。

Input Output Schemas

要更改輸出模式,請在列表中選擇模式,右鍵單擊並選擇“設為當前”。

Change Output Schema

資料質量轉換

資料質量轉換不能直接連線到包含巢狀表的上一級轉換。要連線這些轉換,您應該在巢狀表和資料質量轉換之間的轉換中新增查詢轉換或 XML 管道轉換。

如何使用資料質量轉換?

步驟 1 - 轉到物件庫 → 轉換選項卡

Library Transform Tab

步驟 2 - 展開資料質量轉換,並新增要新增到資料流的轉換或轉換配置。

Transform Configuration

步驟 3 - 繪製資料流連線。雙擊轉換的名稱,將開啟轉換編輯器。在輸入模式中,選擇要對映的輸入欄位。

注意 - 要使用關聯轉換,您可以向輸入選項卡新增使用者定義的欄位。

文字資料處理轉換

文字資料處理轉換允許您從大量文字中提取特定資訊。您可以搜尋特定於組織的事實和實體,例如客戶、產品和財務事實。

此轉換還會檢查實體之間的關係並允許提取。使用文字資料處理提取的資料可用於商業智慧、報告、查詢和分析。

實體提取轉換

在資料服務中,文字資料處理藉助實體提取完成,實體提取從非結構化資料中提取實體和事實。

這涉及分析和處理大量文字資料,搜尋實體,將它們分配到適當的型別,並以標準格式呈現元資料。

實體提取轉換可以從任何文字、HTML、XML 或某些二進位制格式(例如 PDF)內容中提取資訊並生成結構化輸出。您可以根據工作流以多種方式使用輸出。您可以將其用作另一個轉換的輸入,或寫入多個輸出源,例如資料庫表或平面檔案。輸出以 UTF-16 編碼生成。

實體提取轉換可用於以下場景:

  • 從大量文字中查詢特定資訊。

  • 使用現有資訊從非結構化文字中查詢結構化資訊以建立新的連線。

  • 產品質量報告和分析。

TDP 和資料清理之間的區別

文字資料處理用於從非結構化文字資料中查詢相關資訊。但是,資料清理用於標準化和清理結構化資料。

引數 文字資料處理 資料清理
輸入型別 非結構化資料 結構化資料
輸入大小 大於 5KB 小於 5KB
輸入範圍 具有多種變體的廣泛領域 有限的變體
潛在用途 從非結構化資料中獲取潛在的有意義資訊 儲存到倉庫中的資料質量
輸出 以實體、型別等形式建立註釋。輸入不變 建立標準化欄位,輸入已更改
廣告