
- SAP BODS 教程
- SAP BODS - 首頁
- 資料倉庫 & ETL
- 資料倉庫 - 概述
- 資料倉庫 - 型別
- 資料倉庫 - 產品 & 供應商
- ETL - 簡介
- SAP BO 資料服務
- SAP BODS - 概述
- SAP BODS - 架構
- SAP BODS - 資料服務設計器
- SAP BODS 倉庫
- SAP BODS - 倉庫概述
- 倉庫建立 & 更新
- 資料服務管理控制檯
- SAP BODS - DSMC 模組
- SAP BODS - DS 設計器簡介
- SAP BODS - DS 設計器中的 ETL 流程
- SAP BODS 資料儲存 & 格式
- SAP BODS - 資料儲存概述
- SAP BODS - 更改資料儲存
- SAP BODS - 記憶體資料儲存
- SAP BODS - 連結資料儲存
- SAP BODS - 介面卡資料儲存
- SAP BODS - 檔案格式
- COBOL 複製簿檔案格式
- 從資料庫表中提取資料
- 從 Excel 工作簿中提取資料
- SAP BODS 變換
- SAP BODS - 變換型別
- 向資料流新增變換
- SAP BODS - 查詢變換
- SAP BODS 管理
- SAP BODS - 資料服務概述
- 建立嵌入式資料流
- 除錯 & 恢復機制
- 資料評估 & 資料分析
- SAP BODS - 效能最佳化技術
- SAP BODS 有用資源
- SAP BODS - 問答
- SAP BODS - 快速指南
- SAP BODS - 有用資源
- SAP BODS - 討論
SAP BODS 面試題
尊敬的讀者們,這些 **SAP BODS 面試題** 旨在讓您熟悉在 **SAP BODS** 相關面試中可能遇到的問題型別。根據我的經驗,優秀的 interviewers 很少會提前計劃好要問哪些具體問題,通常會從主題的一些基本概念開始,然後根據後續討論和您的回答繼續提問。
**索引** − OLTP 系統只有少量索引,而 OLAP 系統則有很多索引以最佳化效能。
**連線** − 在 OLTP 系統中,連線數量較多,資料是規範化的;而在 OLAP 系統中,連線數量較少,資料是反規範化的。
**聚合** − 在 OLTP 系統中,資料未進行聚合;而在 OLAP 資料庫中,使用了更多聚合。
ETL 載入過程中需要暫存區。需要暫存區的原因有很多:
由於源系統僅在特定時間段內可用以提取資料,而這段時間小於總資料載入時間,因此暫存區允許您在時間段結束前從源系統提取資料並將其儲存在暫存區中。
當您想要將來自多個數據源的資料組合在一起時,需要暫存區。如果您想要連線兩個或多個系統。例如:您將無法執行連線來自兩個物理不同資料庫的兩個表的 SQL 查詢。
不同系統的資料提取時間段因時區和運營時間而異。
從源系統提取的資料可用於多個數據倉庫系統、運營資料儲存等。
在 ETL 過程中,您可以執行復雜的轉換,這需要額外的區域來儲存資料。
SAP BO 資料服務是一個用於資料整合、資料質量、資料分析和資料處理的 ETL 工具,它允許您將經過整合和轉換的可靠資料整合到資料倉庫系統中,用於分析報告。
BO 資料服務包含一個 UI 開發介面、元資料倉庫、與源系統和目標系統的資料庫連線以及用於作業排程的管理控制檯。
您還可以將 BODS 架構劃分為以下幾層:
Web 應用程式層、資料庫伺服器層、資料服務服務層。

倉庫用於儲存在 BO 資料服務中使用的物件的元資料。每個倉庫都應在中央管理控制檯 (CMC) 中註冊,並與一個或多個作業伺服器連結,這些伺服器負責執行您建立的作業。
有三種類型的倉庫:
**本地倉庫** −
它用於儲存在資料服務設計器中建立的所有物件的元資料,例如專案、作業、資料流、工作流等。
**中央倉庫** −
它用於控制物件的版本管理,並用於多使用者開發。中央倉庫儲存應用程式物件的全部版本,因此允許您切換到以前的版本。
**分析器倉庫** −
這用於管理與在 SAP BODS 設計器中執行的分析器任務相關的所有元資料。CMS 倉庫儲存在 BI 平臺上 CMC 上執行的所有任務的元資料。Information Steward 倉庫儲存在 Information Steward 中建立的所有分析任務和物件的元資料。
**可重用物件** −
儲存在倉庫中的大多數物件都可以重用。當定義可重用物件並將其儲存在本地倉庫中時,您可以透過建立對定義的呼叫來重用該物件。每個可重用物件只有一個定義,對該物件的所有呼叫都引用該定義。現在,如果在一個地方更改了物件的定義,那麼您就是在更改該物件出現在所有地方的定義。
物件庫用於包含物件定義,當從庫中拖放物件時,表示建立了對現有物件的新的引用。
**單一使用物件** −
所有專門為作業或資料流定義的物件都稱為單一使用物件。例如:在任何資料載入中使用的特定轉換。
資料儲存用於設定應用程式和資料庫之間的連線。您可以直接建立資料儲存,也可以藉助介面卡建立資料儲存。資料儲存允許應用程式/軟體讀取或寫入來自應用程式或資料庫的元資料,以及寫入該資料庫或應用程式。

要建立 BODS 倉庫,您需要安裝一個數據庫。您可以使用 SQL Server、Oracle 資料庫、MySQL、SAP HANA、Sybase 等。在安裝 BODS 和建立倉庫時,您必須在資料庫中建立以下使用者。這些使用者需要登入不同的伺服器 CMS 伺服器、審計伺服器。要建立一個新的倉庫,您必須登入倉庫管理器。
即時作業從接收到的即時訊息正文以及作業中使用的任何輔助來源“提取”資料。
中央倉庫用於控制物件的版本管理,並用於多使用者開發。中央倉庫儲存應用程式物件的全部版本,因此允許您切換到以前的版本。
資料服務管理控制檯
在資料服務中,您可以建立一個模板表以移動到目標系統,該系統具有與源表相同的結構和資料型別。
DS 管理控制檯 → 作業執行歷史記錄
它是一個開發工具,用於建立包含資料對映、轉換和邏輯的物件。它是基於 GUI 的,並且充當資料服務的設計器。
您可以使用資料服務設計器建立各種物件,例如專案、作業、工作流、資料流、對映、轉換等。
在 DS 設計器中的物件庫中
您可以使用記憶體作為資料庫型別建立資料儲存。記憶體資料儲存用於提高即時作業中資料流的效能,因為它將資料儲存在記憶體中以方便快速訪問,並且不需要轉到原始資料來源。
記憶體資料儲存用於在倉庫中儲存記憶體表模式。這些記憶體表從關係資料庫中的表或使用分層資料檔案(如 XML 訊息和 IDoc)獲取資料。
記憶體表在作業執行期間保持活動狀態,並且記憶體表中的資料不能在不同的即時作業之間共享。
有各種資料庫供應商只提供從一個數據庫到另一個數據庫的單向通訊路徑。這些路徑稱為資料庫連結。在 SQL Server 中,連結伺服器允許從一個數據庫到另一個數據庫的單向通訊路徑。
**示例** −
考慮一個本地資料庫伺服器名稱“Product”儲存資料庫連結以訪問名為 Customer 的遠端資料庫伺服器上的資訊。現在連線到遠端資料庫伺服器 Customer 的使用者無法使用相同的連結來訪問資料庫伺服器 Product 中的資料。“Customer”連線的使用者應該在伺服器的資料字典中擁有一個單獨的連結才能訪問 Product 資料庫伺服器中的資料。
這兩個資料庫之間的通訊路徑稱為資料庫連結,在此連結的資料庫關係之間建立的資料儲存稱為連結資料儲存。
有可能將資料儲存連線到另一個數據儲存,並將外部資料庫連結作為資料儲存的選項匯入。
介面卡資料儲存允許您將應用程式元資料匯入倉庫。您還可以訪問應用程式元資料,並且還可以移動不同應用程式和軟體之間的批處理和即時資料。
- 分隔符
- SAP傳輸
- 非結構化文字
- 非結構化二進位制
- 固定寬度
您可以使用Data Services中的檔案格式將Microsoft Excel工作簿用作資料來源。Excel工作簿應位於Windows檔案系統或Unix檔案系統上。
資料流用於從源系統提取、轉換和載入資料到目標系統。所有轉換、載入和格式化都在資料流中進行。
- 源
- 目標
- 轉換
- 一次執行
- 並行性
- 資料庫連結
- 快取
工作流用於確定執行工作流的流程。工作流的主要目的是準備執行資料流,並在資料流執行完成後設定系統的狀態。
- 工作流
- 資料流
- 指令碼
- 迴圈
- 條件
- Try或Catch塊
可以
假設您要更新一個事實表,並且您已經建立了一個包含轉換的資料流。現在,如果您想將資料從源系統移動到目標系統,則必須檢查事實表的最後修改時間,以便只提取上次更新後新增的行。
為了實現這一點,您必須建立一個指令碼,該指令碼確定上次更新日期,然後將其作為輸入引數傳遞給資料流。
您還必須檢查與特定事實表的資料庫連線是否處於活動狀態。如果它不處於活動狀態,則需要設定一個Catch塊,該塊會自動向管理員傳送電子郵件以通知此問題。
您還可以向工作流中新增條件語句。這允許您在工作流上實現If/Else/Then邏輯。
轉換用於操作資料集作為輸入,並建立一個或多個輸出。Data Services中可以使用各種轉換。
- 資料整合
- 資料質量
- 平臺
- 合併
- 查詢
- 文字資料處理
- 資料生成器 (Data_Generator)
- 資料傳輸 (Data_Transfer)
- 生效日期 (Effective_Date)
- 層次結構扁平化 (Hierarchy_flattening)
- 表比較 (Table_Comparision) 等。
這是Data Services中最常用的轉換,您可以執行以下功能:
從源中過濾資料
連線來自多個源的資料
對資料執行函式和轉換
將列從輸入對映到輸出模式
分配主鍵
新增新的列、模式和函式到輸出模式
由於查詢轉換是最常用的轉換,因此工具面板中為此查詢提供了一個快捷方式。
這允許您從大量文字中提取特定資訊。您可以搜尋與組織相關的客戶、產品和財務事實等事實和實體。
此轉換還檢查實體之間的關係並允許提取。
使用文字資料處理提取的資料可用於商業智慧、報告、查詢和分析。
文字資料處理用於從非結構化文字資料中查詢相關資訊,而資料清洗用於標準化和清洗結構化資料。
您可以在Data Services設計器中建立即時作業來處理即時訊息。與批處理作業一樣,即時作業提取資料、轉換資料並載入資料。
每個即時作業可以從單個訊息中提取資料,也可以從其他來源(如表或檔案)提取資料。
與設計器中的批處理作業不同,分支和控制邏輯之類的轉換在即時作業中更常用。
與批處理作業不同,即時作業不是根據排程或內部觸發器執行的。
嵌入式資料流是指在設計中從另一個數據流呼叫的資料流。嵌入式資料流可以包含多個源和目標,但只有一個輸入或輸出將資料傳遞到主資料流。
**單輸入** - 嵌入式資料流新增到資料流的末尾。
**單輸出** - 嵌入式資料流新增到資料流的開頭。
**無輸入或輸出** - 複製現有的資料流。
Data Services中的區域性變數僅限於建立它們的物件。
全域性變數僅限於建立它們的作業。使用全域性變數,您可以更改執行時預設全域性變數的值。
在工作流和資料流中使用的表示式稱為引數。
工作流和資料流中的所有變數和引數都顯示在變數和引數視窗中。
自動恢復 - 這允許您在恢復模式下執行失敗的作業。
手動恢復 - 這允許您重新執行作業,而不考慮上次部分重新執行。
Data Services設計器提供資料分析功能,以確保和提高源資料的質量和結構。資料分析器允許您:
查詢源資料中的異常、驗證和糾正操作以及源資料的質量。
源資料的結構和關係,以便更好地執行作業、工作流和資料流。
源系統和目標系統的內容,以確定您的作業是否按預期返回結果。
ETL作業的效能取決於您使用Data Services軟體的系統、移動次數等。還有其他各種因素會影響ETL任務的效能:
- 源資料庫
- 源作業系統
- 目標資料庫
- 目標作業系統
- 網路
- 作業伺服器作業系統
- BODS儲存庫資料庫
SAP BO Data Services支援多使用者開發,每個使用者可以在他們自己的本地儲存庫中處理應用程式。每個團隊使用中央儲存庫來儲存應用程式的主要副本和應用程式中所有物件的版本。
在SAP Data Services中,作業遷移可以應用於不同的級別:應用程式級別、儲存庫級別、升級級別。
要將一箇中央儲存庫的內容複製到另一箇中央儲存庫,您不能直接執行此操作,您需要使用本地儲存庫。
首先是從中央儲存庫獲取所有物件的最新版本到本地儲存庫。啟用您要複製內容的中央儲存庫。
新增您要從本地儲存庫複製到中央儲存庫的所有物件。
如果您更新SAP Data Services的版本,則需要更新儲存庫的版本。遷移中央儲存庫以升級版本時,應考慮以下幾點:
要點1
備份中央儲存庫的所有表和物件。
要點2
要維護Data Services中物件的版本,請為每個版本維護一箇中央儲存庫。使用新版本的Data Services軟體建立一個新的中央歷史記錄,並將所有物件複製到此儲存庫。
要點3
始終建議您如果安裝新版本的Data Services,則應將中央儲存庫升級到新版本的物件。
要點4
還要將本地儲存庫升級到與中央儲存庫相同的版本,因為不同版本的中央儲存庫和本地儲存庫可能無法同時工作。
要點5
遷移中央儲存庫之前,請簽入所有物件。由於您不會同時升級中央儲存庫和本地儲存庫,因此需要簽入所有物件。因為一旦您的中央儲存庫升級到新版本,您將無法簽入來自使用舊版本Data Services的本地儲存庫的物件。
SCD是隨時間變化的資料維度。
SCD型別1:不保留歷史記錄
規範化的自然結果
SCD型別2:保留所有歷史記錄和新行
為重大更改生成新行
需要使用唯一鍵
生成新欄位以儲存歷史資料
需要管理一個有效日期欄位 (Effective_Date)。
SCD型別3:有限的歷史記錄保留
在此,只保留資料的兩種狀態 - 當前和舊。
不是,檔案格式不是資料儲存型別。
下一步是什麼?
接下來,您可以回顧一下您過去完成的與主題相關的作業,並確保您可以自信地談論它們。如果您是應屆畢業生,面試官不會期望您回答非常複雜的問題,而是您必須使您的基本概念非常紮實。
其次,如果您無法回答一些問題,這真的無關緊要,重要的是,無論您回答了什麼,您都必須充滿自信地回答。所以在面試時要自信。我們在tutorialspoint祝您面試順利,並祝您未來的事業一切順利。乾杯 :-)