Amazon Q 商業版 - 資料來源聯結器



資料來源聯結器是一種將來自不同資料來源的資料組合和修改到單個容器索引中的技術。Amazon Q 商業版提供了多種資料來源聯結器,幫助您以最少的配置建立智慧生成式 AI 解決方案。

本章概述了資料來源聯結器功能、配置以及與您的資料來源聯結器相關的資訊。

資料來源聯結器概念

要了解資料來源聯結器的配置,需要了解一些與其相關的特定術語。

  • 源和端點元資料:資料來源配置資訊位於控制檯的源部分。如果您使用 API,則可以使用 **CreateDataSource** 操作的配置引數指定此資訊。不同的連線源根據資料來源具有不同的配置資訊。
  • 授權:Amazon Q 商業版包含聯結器索引訪問控制列表 (ACL),其中包含有關使用者電子郵件地址、本地組的組名稱、聯合組的組名稱的資訊。
  • 身份驗證:Amazon Q 商業版具有AWS Secrets Manager 金鑰,它幫助 Amazon Q 商業版透過您提供的資料來源訪問憑證對您的資料來源訪問進行身份驗證。
  • 虛擬私有云:Amazon Q 商業版具有虛擬私有云,用於儲存資料來源或資料庫。您可以將 Amazon VPC 與控制檯或 Amazon Q 商業版 API 配合使用。
  • Web 代理:用於將資料來源例項連線到所有支援的資料來源,為此您必須提供主機名和埠號。
  • IAM 角色:資料來源聯結器需要具有授權和身份驗證功能的 IAM 角色。
  • 身份爬蟲:Amazon Q 商業版具有身份爬取功能,使它能夠從支援的資料來源中爬取文件級別的 ACL 資訊。
  • 同步範圍:Amazon Q 商業版具有同步範圍功能,用於自定義資料來源聯結器爬取和索引的內容。
  • 同步模式:用於自定義資料來源內容發生變化時與索引同步的內容。
  • 同步執行計劃:Amazon Q 商業版具有同步執行計劃功能,可以根據自定義計劃定期將資料來源與檢索器同步。
  • 欄位對映:用於將 Amazon Q 商業版索引欄位與資料來源文件屬性對映。

什麼是文件?

當您將 Amazon Q 商業版連線到資料來源時,將什麼視為單個“文件”取決於您使用的連線型別。

下表概述了每個聯結器爬取的內容作為文件。

資料來源聯結器 支援爬取 文件定義
Adobe Experience Manager(雲和伺服器)
  • 資產
  • 頁面
  • 每個資產都被視為單個文件。
  • 每個頁面都被視為單個文件。
Alfresco(雲和伺服器)
  • 檔案
  • 評論
  • 每個檔案都被視為單個文件。
  • 每個評論都被視為單個文件。
Amazon FSx(Windows) 檔案 每個檔案都被視為單個文件。
Amazon S3 物件 每個物件都被視為單個文件。任何 object-name.metadata.json 檔案和訪問控制列表 (ACL) 檔案都被視為與其關聯的物件的元資料,而不是作為單獨的文件處理。
Amazon Q 商業版 Web 爬蟲
  • 網頁
  • 附件
  • 每個網頁都被視為單個文件。
  • 每個附件都被視為單個文件。
Amazon WorkDocs
  • 檔案
  • 評論
  • 每個檔案都被視為單個文件。
  • 每個評論都被視為單個文件。
Box
  • 檔案
  • 任務
  • 評論
  • 網頁連結
  • 每個檔案都被視為單個文件。
  • 每個任務都被視為單個文件。
  • 每個評論都被視為單個文件。
  • 每個網頁連結都被視為單個文件。
Confluence(雲和伺服器)
  • 空間
  • 頁面
  • 部落格
  • 評論
  • 附件
  • 每個空間都被視為單個文件。
  • 每個頁面都被視為單個文件。
  • 每個部落格都被視為單個文件。
  • 每個評論都被視為單個文件。
  • 每個附件都被視為單個文件。
資料庫資料來源
  • Aurora(MySQL)
  • Aurora(PostgreSQL)
  • Amazon RDS(Microsoft SQL Server)
  • Amazon RDS(MySQL)
  • Amazon RDS(Oracle)
  • Amazon RDS(PostgreSQL)
  • IBM DB2
  • PostgreSQL
  • Microsoft SQL Server
  • MySQL
  • Oracle 資料庫
  • 單個數據庫中的表資料
  • 單個數據庫中的檢視資料
  • 表和檢視中的每一行都被視為單個文件。
Dropbox
  • 檔案
  • 文件
  • 文件模板
  • 快捷方式
  • 每個檔案都被視為單個文件。
  • 每個文件都被視為單個文件。
  • 每個文件模板都被視為單個文件。
  • 每個快捷方式都被視為單個文件。
Drupal
  • 文章
  • 基本頁面
  • 基本塊
  • 自定義內容
  • 自定義塊
  • 文章、基本頁面、基本塊、自定義內容和自定義塊的評論
  • 文章、基本頁面、基本塊、自定義內容和自定義塊的附件
  • 每篇文章都被視為單個文件。
  • 每個基本頁面都被視為單個文件。
  • 每個基本塊都被視為單個文件。
  • 每個自定義內容都被視為單個文件。
  • 每個自定義塊都被視為單個文件。
  • 文章、基本頁面、基本塊、任何自定義內容和自定義塊上的每個評論都被視為文件。
  • 文章、基本頁面、基本塊、任何自定義內容和自定義塊中的每個附件都被視為文件。
GitHub(雲和伺服器)
  • 儲存庫
  • 儲存庫提交
  • 問題
  • 問題附件
  • 問題評論
  • 拉取請求文件
  • 拉取請求評論
  • 拉取請求附件
  • 每個儲存庫都被視為單個文件。
  • 每個儲存庫提交都被視為單個文件。
  • 每個問題都被視為單個文件。
  • 每個問題附件都被視為單個文件。
  • 每個問題評論都被視為單個文件。
  • 每個拉取請求都被視為單個文件。
  • 每個拉取請求評論都被視為單個文件。
  • 每個拉取請求附件都被視為單個文件。
Gmail
  • 電子郵件
  • 電子郵件附件
  • 每封電子郵件都被視為單個文件。
  • 每個電子郵件附件都被視為單個文件。
Google Drive
  • 檔案
  • 評論
  • 每個檔案都被視為單個文件。
  • 每個評論都被視為單個文件。
Jira
  • 專案
  • 問題
  • 評論
  • 附件
  • 工作日誌
  • 每個專案都被視為單個文件。
  • 每個評論都被視為單個文件。
  • 每個問題都被視為單個文件。
  • 每個評論都被視為單個文件。
  • 每個附件都被視為單個文件。
  • 每個工作日誌都被視為單個文件
Microsoft Exchange
  • 電子郵件
  • 附件
  • 日曆
  • 聯絡人
  • 筆記
  • OneNotes
  • 每封電子郵件都被視為單個文件。
  • 每個附件都被視為單個文件。
  • 每個日曆都被視為單個文件。
  • 每個評論都被視為單個文件。
  • 每個聯絡人都被視為單個文件。
  • 每個筆記都被視為單個文件。
  • OneNotes 中的每個頁面都被視為單個文件。
Microsoft OneDrive
  • 檔案
  • OneNotes
  • 每個檔案都被視為單個文件。
  • OneNotes 中的每個頁面都被視為單個文件。
Microsoft SharePoint(線上和伺服器)
  • 事件
  • 頁面
  • 檔案
  • 連結
  • 檔案附件
  • 評論
  • OneNotes
  • 每個事件都被視為單個文件。
  • 每個頁面都被視為單個文件。
  • 每個檔案都被視為單個文件。
  • 每個連結都被視為單個文件。
  • 每個檔案附件都被視為單個文件。
  • 每個評論都被視為單個文件。
  • OneNotes 中的每個頁面都被視為單個文件。
Microsoft Teams
  • 聊天訊息
  • 聊天附件
  • 頻道帖子
  • 頻道 Wiki
  • 頻道附件
  • 會議聊天
  • 會議檔案
  • 會議筆記
  • 日曆會議
  • OneNotes
  • 每條聊天訊息都被視為單個文件。
  • 每個聊天附件都被視為單個文件。
  • 每個頻道帖子都被視為單個文件。
  • 每個頻道 Wiki 被視為單個文件。
  • 每個頻道附件都被視為單個文件。
  • 每次會議聊天都被視為單個文件。
  • 每個會議檔案都被視為單個文件。
  • 每個會議筆記都被視為單個文件。
  • 每個日曆會議都被視為單個文件。
  • OneNotes 中的每個頁面都被視為單個文件。
Microsoft Yammer
  • 社群
  • 附件
  • 訊息
  • 使用者
  • 每個社群都被視為單個文件。
  • 每個附件都被視為單個文件。
  • 每條訊息和社群帖子都被視為單個文件。
  • 每個使用者都被視為單個文件。
Quip
  • 檔案
  • 訊息
  • 執行緒
  • 每個檔案都被視為單個文件。
  • 每個評論都被視為單個文件。
  • 執行緒中釋出的每個檔案和訊息都被視為單個文件。
Salesforce
  • 賬戶
  • 聯絡人
  • 活動
  • 合同
  • 案例
  • 合作伙伴
  • 商機
  • 潛在客戶
  • 使用者
  • 任務
  • 想法
  • 個人資料
  • 解決方案
  • 聊天
  • 文件
  • 自定義實體
  • 知識文章
  • 每個賬戶都被視為單個文件。
  • 每個聯絡人都被視為單個文件。
  • 每個廣告系列都被視為單個文件。
  • 每個合同都被視為單個文件。
  • 每個案例都被視為單個文件。
  • 每個合作伙伴都被視為單個文件。
  • 每個商機都被視為單個文件。
  • 每個組都被視為單個文件。
  • 每個潛在客戶都被視為單個文件。
  • 每個使用者都被視為單個文件。
  • 每個任務都被視為單個文件。
  • 每個想法都被視為單個文件。
  • 每個個人資料都被視為單個文件。
  • 每個解決方案都被視為單個文件。
  • 每個 Chatter 都被視為單個文件。
  • 每個文件(檔案)都被視為單個文件。
  • 每個自定義實體(記錄)都被視為單個文件。
  • 每個知識文章都被視為單個文件。
ServiceNow
  • 事件
  • 知識文章
  • 服務目錄
  • 附件
  • 每個事件都被視為單個文件。
  • 每個知識文章都被視為單個文件。
  • 每個服務目錄都被視為單個文件。
  • 每個附件都被視為單個文件。
Slack
  • 訊息
  • 訊息附件
  • 頻道帖子
  • 每條訊息都被視為單個文件。
  • 每個訊息附件都被視為單個文件。
  • 每個頻道帖子都被視為單個文件。
Zendesk
  • 工單
  • 工單評論
  • 工單評論附件
  • 文章
  • 文章附件
  • 文章評論
  • 社群主題
  • 社群帖子
  • 社群帖子評論
  • 每個工單都被視為單個文件。
  • 每個工單評論都被視為單個文件。
  • 每個工單評論附件都被視為單個文件。
  • 每篇文章都被視為單個文件。
  • 每個文章附件都被視為單個文件。
  • 每個文章評論都被視為單個文件。
  • 每個社群主題都被視為單個文件。
  • 每個社群帖子都被視為單個文件。
  • 每個社群帖子評論都被視為單個文件。

配置最佳實踐

以下列表描述了設定和配置 Amazon Q Business 資料來源聯結器的最佳實踐

  • 索引中的每個文件都必須是唯一的。確保在您計劃連線到 Amazon Q Business 檢索器的任何資料來源中或跨任何資料來源不存在重複的文件。
  • 更改身份驗證型別或憑證時,請更新 IAM 角色以訪問正確的 AWS Secrets Manager 金鑰 ID。
  • 為了您自身的安全性,請確保定期更新您的憑證和金鑰。僅授予所需許可權,並且不要在不同的資料來源之間重複使用它們。
  • 用於資料檢索器的 IAM 角色不能用於資料來源。如果您不確定角色的用途,請建立一個新的 IAM 角色以防止錯誤。
  • 在應用程式中使用 AWS KMS 金鑰時,請確保應用程式環境的 IAM 角色具有必要的許可權來使用金鑰描述、加密和解密資料。
  • Amazon Q Business 透過使用 Secrets Manager 驗證用於訪問本地或伺服器資料來源的端點資訊來增強安全性,從而防止“混淆代理”問題,在該問題中,沒有直接訪問許可權的使用者可能會透過代理間接獲得訪問許可權。端點更改會在 Secrets Manager 中建立一個新的金鑰以反映更新的資訊。
  • 大多數資料來源使用正則表示式模式,這些模式是稱為過濾器的包含或排除模式。

瞭解使用者儲存

Amazon Q Business 具有使用者儲存功能,允許使用者僅檢視從他們有權訪問的應用程式內文件生成的聊天回覆。這意味著使用者只能檢視與其許可權和他們被授權檢視的資料相關的回覆。

使用者儲存如何工作?

以下步驟顯示了 Amazon Q Business 使用者儲存的工作原理

  • 在 Amazon Q Business 中,任何資料來源中的每個文件都具有訪問控制列表 (ACL) 資訊作為元資料固有地附加到其中。
  • ACL 包含有關哪些使用者和組有權訪問文件的資訊。
  • 然後聯結器可以抓取並使用您資料來源中的 ACL 資訊。
  • 並重新同步您的資料來源以捕獲 ACL 更改並確保正確的使用者訪問許可權。
  • Amazon Q Business 從每個資料來源抓取使用者和組資訊並在內部對其進行對映。
  • 然後使用者和組資訊儲存在使用者儲存中以匹配文件訪問詳細資訊。
  • 如果您在使用者儲存中刪除一個組,然後稍後使用相同的名稱但不同的組成員重新建立它,則包含此組的文件 ACL 可能會受到影響。
  • 如果新使用者具有相同的電子郵件地址,請從使用者儲存中刪除舊使用者。Amazon Q Business 將驗證使用者屬性,如果存在差異,則拒絕訪問。

使用 Amazon VPC

Amazon Q Business 可以連線到您的虛擬私有云 (VPC) 以索引內容。它可以做到這一點,因為您可以告訴 Amazon Q Business 它訪問您的 VPC 所需的安全資訊。這樣,Amazon Q Business 就可以安全地與您虛擬私有云中的資料來源通訊。

資料來源聯結器故障排除

現在我們將解決 Amazon Q Business 資料來源聯結器的一些問題。

  • 我的文件未被索引:Amazon Q Business 具有一個用於索引資料的兩步過程。錯誤可能發生在資料來源級別或文件級別。資料來源錯誤在控制檯中報告,而文件級錯誤在 Amazon CloudWatch Logs 中報告。這有助於您識別和解決阻止文件被索引的任何問題。
  • 我的同步作業失敗:Amazon Q Business 同步作業可能會因索引或資料來源中的配置錯誤而失敗。這些錯誤通常與 Amazon Q Business 訪問其所需資源的 IAM 許可權不足有關。資料來源詳細資訊頁面“同步執行歷史記錄”部分中的錯誤訊息提供了有關缺少許可權的詳細資訊。以下是您可能收到的一些錯誤訊息
    • 無法為作業建立日誌組。請確保提供的 IAM 角色具有足夠的許可權。
    • 嘗試抓取元資料檔案時無法訪問 Amazon S3 檔案字首(儲存桶名稱)。請確保提供的 IAM 角色 (ARN) 具有足夠的許可權。
    • 無法假定提供的 IAM 角色 (ARN)。請確保 Amazon Q Business 是允許假定該角色的可信實體。
  • 我的同步作業未完成:要解決未完成的同步作業,請首先檢視您的 CloudWatch 日誌。
    • 從“詳細資訊”列中,選擇“在 CloudWatch 中檢視詳細資訊”。
    • 檢視錯誤訊息以瞭解導致文件失敗的原因。
  • 我的同步作業成功,但沒有索引的文件:可能的原因包括以下內容
    • 檢查 CloudWatch DocumentsSubmittedForIndexingFailed 指標以檢視是否有任何文件無法同步。檢查您的 CloudWatch 日誌以獲取詳細資訊。
    • 對於 Amazon S3 資料來源,您可能為 Amazon Q Business 提供了錯誤的儲存桶名稱或字首。確保 Amazon Q Business 使用的 S3 儲存桶是包含要索引的文件的儲存桶。
    • 在重新索引在較早作業中無法索引的文件時,除非您更改了文件或其關聯的元資料檔案,否則 Amazon Q Business 不會對其進行索引。
  • 在同步資料來源時遇到檔案格式問題
    如果您在將檔案新增到資料來源或同步資料來源時遇到檔案格式問題,請確保您的文件型別受 Amazon Q Business 支援。
  • 在使用 SSL 證書檔案時收到“AccessDenied”錯誤訊息
    如果您在將 SSL 證書與資料來源一起使用時收到“訪問被拒絕”錯誤,請檢查 IAM 角色是否具有訪問證書檔案的必要許可權。如果證書使用 AWS KMS 金鑰加密,請確保您的 IAM 角色還具有使用 AWS KMS 金鑰解密證書的許可權。
廣告

© . All rights reserved.