- Amazon Q 教程
- Amazon Q - 首頁
- Amazon Q - 簡介
- Amazon Q 商業版使用者指南
- Amazon Q 商業版 - 工作流程
- Amazon Q 商業版 - 關鍵概念
- Amazon Q 商業版 - 訂閱層級和索引型別
- Amazon Q 商業版 - 服務配額
- Amazon Q 商業版 - 文件屬性
- Amazon Q 商業版 - 設定
- Amazon Q 商業版 - Identity Center 目錄
- Amazon Q 商業版 - Identity Center 整合應用程式
- Amazon Q 商業版 - Identity Federation 應用程式
- Amazon Q 商業版 - 資料來源聯結器
- Amazon Q 商業版 - 增強應用程式
- Amazon Q 商業版 - 功能
- Amazon Q 商業版 - 安全性
- Amazon Q 商業版 - 監控
- Amazon Q 商業版 API 參考
- Amazon Q 商業版 - API 概述
- Amazon Q 商業版 - API 參考
- Amazon Q 商業版 - 支援的操作
- Amazon Q 商業版 - 支援的資料型別
- Amazon Q 商業版 - 常用引數
- Amazon Q 商業版 - 常見錯誤
Amazon Q 商業版 - 資料來源聯結器
資料來源聯結器是一種將來自不同資料來源的資料組合和修改到單個容器索引中的技術。Amazon Q 商業版提供了多種資料來源聯結器,幫助您以最少的配置建立智慧生成式 AI 解決方案。
本章概述了資料來源聯結器功能、配置以及與您的資料來源聯結器相關的資訊。
資料來源聯結器概念
要了解資料來源聯結器的配置,需要了解一些與其相關的特定術語。
- 源和端點元資料:資料來源配置資訊位於控制檯的源部分。如果您使用 API,則可以使用 **CreateDataSource** 操作的配置引數指定此資訊。不同的連線源根據資料來源具有不同的配置資訊。
- 授權:Amazon Q 商業版包含聯結器索引訪問控制列表 (ACL),其中包含有關使用者電子郵件地址、本地組的組名稱、聯合組的組名稱的資訊。
- 身份驗證:Amazon Q 商業版具有AWS Secrets Manager 金鑰,它幫助 Amazon Q 商業版透過您提供的資料來源訪問憑證對您的資料來源訪問進行身份驗證。
- 虛擬私有云:Amazon Q 商業版具有虛擬私有云,用於儲存資料來源或資料庫。您可以將 Amazon VPC 與控制檯或 Amazon Q 商業版 API 配合使用。
- Web 代理:用於將資料來源例項連線到所有支援的資料來源,為此您必須提供主機名和埠號。
- IAM 角色:資料來源聯結器需要具有授權和身份驗證功能的 IAM 角色。
- 身份爬蟲:Amazon Q 商業版具有身份爬取功能,使它能夠從支援的資料來源中爬取文件級別的 ACL 資訊。
- 同步範圍:Amazon Q 商業版具有同步範圍功能,用於自定義資料來源聯結器爬取和索引的內容。
- 同步模式:用於自定義資料來源內容發生變化時與索引同步的內容。
- 同步執行計劃:Amazon Q 商業版具有同步執行計劃功能,可以根據自定義計劃定期將資料來源與檢索器同步。
- 欄位對映:用於將 Amazon Q 商業版索引欄位與資料來源文件屬性對映。
什麼是文件?
當您將 Amazon Q 商業版連線到資料來源時,將什麼視為單個“文件”取決於您使用的連線型別。
下表概述了每個聯結器爬取的內容作為文件。
| 資料來源聯結器 | 支援爬取 | 文件定義 |
|---|---|---|
| Adobe Experience Manager(雲和伺服器) |
|
|
| Alfresco(雲和伺服器) |
|
|
| Amazon FSx(Windows) | 檔案 | 每個檔案都被視為單個文件。 |
| Amazon S3 | 物件 | 每個物件都被視為單個文件。任何 object-name.metadata.json 檔案和訪問控制列表 (ACL) 檔案都被視為與其關聯的物件的元資料,而不是作為單獨的文件處理。 |
| Amazon Q 商業版 Web 爬蟲 |
|
|
| Amazon WorkDocs |
|
|
| Box |
|
|
| Confluence(雲和伺服器) |
|
|
資料庫資料來源
|
|
|
| Dropbox |
|
|
| Drupal |
|
|
| GitHub(雲和伺服器) |
|
|
| Gmail |
|
|
| Google Drive |
|
|
| Jira |
|
|
| Microsoft Exchange |
|
|
| Microsoft OneDrive |
|
|
| Microsoft SharePoint(線上和伺服器) |
|
|
| Microsoft Teams |
|
|
| Microsoft Yammer |
|
|
| Quip |
|
|
| Salesforce |
|
|
| ServiceNow |
|
|
| Slack |
|
|
| Zendesk |
|
|
配置最佳實踐
以下列表描述了設定和配置 Amazon Q Business 資料來源聯結器的最佳實踐
- 索引中的每個文件都必須是唯一的。確保在您計劃連線到 Amazon Q Business 檢索器的任何資料來源中或跨任何資料來源不存在重複的文件。
- 更改身份驗證型別或憑證時,請更新 IAM 角色以訪問正確的 AWS Secrets Manager 金鑰 ID。
- 為了您自身的安全性,請確保定期更新您的憑證和金鑰。僅授予所需許可權,並且不要在不同的資料來源之間重複使用它們。
- 用於資料檢索器的 IAM 角色不能用於資料來源。如果您不確定角色的用途,請建立一個新的 IAM 角色以防止錯誤。
- 在應用程式中使用 AWS KMS 金鑰時,請確保應用程式環境的 IAM 角色具有必要的許可權來使用金鑰描述、加密和解密資料。
- Amazon Q Business 透過使用 Secrets Manager 驗證用於訪問本地或伺服器資料來源的端點資訊來增強安全性,從而防止“混淆代理”問題,在該問題中,沒有直接訪問許可權的使用者可能會透過代理間接獲得訪問許可權。端點更改會在 Secrets Manager 中建立一個新的金鑰以反映更新的資訊。
- 大多數資料來源使用正則表示式模式,這些模式是稱為過濾器的包含或排除模式。
瞭解使用者儲存
Amazon Q Business 具有使用者儲存功能,允許使用者僅檢視從他們有權訪問的應用程式內文件生成的聊天回覆。這意味著使用者只能檢視與其許可權和他們被授權檢視的資料相關的回覆。
使用者儲存如何工作?
以下步驟顯示了 Amazon Q Business 使用者儲存的工作原理
- 在 Amazon Q Business 中,任何資料來源中的每個文件都具有訪問控制列表 (ACL) 資訊作為元資料固有地附加到其中。
- ACL 包含有關哪些使用者和組有權訪問文件的資訊。
- 然後聯結器可以抓取並使用您資料來源中的 ACL 資訊。
- 並重新同步您的資料來源以捕獲 ACL 更改並確保正確的使用者訪問許可權。
- Amazon Q Business 從每個資料來源抓取使用者和組資訊並在內部對其進行對映。
- 然後使用者和組資訊儲存在使用者儲存中以匹配文件訪問詳細資訊。
- 如果您在使用者儲存中刪除一個組,然後稍後使用相同的名稱但不同的組成員重新建立它,則包含此組的文件 ACL 可能會受到影響。
- 如果新使用者具有相同的電子郵件地址,請從使用者儲存中刪除舊使用者。Amazon Q Business 將驗證使用者屬性,如果存在差異,則拒絕訪問。
使用 Amazon VPC
Amazon Q Business 可以連線到您的虛擬私有云 (VPC) 以索引內容。它可以做到這一點,因為您可以告訴 Amazon Q Business 它訪問您的 VPC 所需的安全資訊。這樣,Amazon Q Business 就可以安全地與您虛擬私有云中的資料來源通訊。
資料來源聯結器故障排除
現在我們將解決 Amazon Q Business 資料來源聯結器的一些問題。
- 我的文件未被索引:Amazon Q Business 具有一個用於索引資料的兩步過程。錯誤可能發生在資料來源級別或文件級別。資料來源錯誤在控制檯中報告,而文件級錯誤在 Amazon CloudWatch Logs 中報告。這有助於您識別和解決阻止文件被索引的任何問題。
- 我的同步作業失敗:Amazon Q Business 同步作業可能會因索引或資料來源中的配置錯誤而失敗。這些錯誤通常與 Amazon Q Business 訪問其所需資源的 IAM 許可權不足有關。資料來源詳細資訊頁面“同步執行歷史記錄”部分中的錯誤訊息提供了有關缺少許可權的詳細資訊。以下是您可能收到的一些錯誤訊息
- 無法為作業建立日誌組。請確保提供的 IAM 角色具有足夠的許可權。
- 嘗試抓取元資料檔案時無法訪問 Amazon S3 檔案字首(儲存桶名稱)。請確保提供的 IAM 角色 (ARN) 具有足夠的許可權。
- 無法假定提供的 IAM 角色 (ARN)。請確保 Amazon Q Business 是允許假定該角色的可信實體。
- 我的同步作業未完成:要解決未完成的同步作業,請首先檢視您的 CloudWatch 日誌。
- 從“詳細資訊”列中,選擇“在 CloudWatch 中檢視詳細資訊”。
- 檢視錯誤訊息以瞭解導致文件失敗的原因。
- 我的同步作業成功,但沒有索引的文件:可能的原因包括以下內容
- 檢查 CloudWatch DocumentsSubmittedForIndexingFailed 指標以檢視是否有任何文件無法同步。檢查您的 CloudWatch 日誌以獲取詳細資訊。
- 對於 Amazon S3 資料來源,您可能為 Amazon Q Business 提供了錯誤的儲存桶名稱或字首。確保 Amazon Q Business 使用的 S3 儲存桶是包含要索引的文件的儲存桶。
- 在重新索引在較早作業中無法索引的文件時,除非您更改了文件或其關聯的元資料檔案,否則 Amazon Q Business 不會對其進行索引。
- 在同步資料來源時遇到檔案格式問題
如果您在將檔案新增到資料來源或同步資料來源時遇到檔案格式問題,請確保您的文件型別受 Amazon Q Business 支援。 - 在使用 SSL 證書檔案時收到“AccessDenied”錯誤訊息
如果您在將 SSL 證書與資料來源一起使用時收到“訪問被拒絕”錯誤,請檢查 IAM 角色是否具有訪問證書檔案的必要許可權。如果證書使用 AWS KMS 金鑰加密,請確保您的 IAM 角色還具有使用 AWS KMS 金鑰解密證書的許可權。
廣告