Amazon Q 商業版 - 文件屬性



本章將介紹文件屬性是什麼,它們在 Amazon Q 商業版中的工作方式,以及它們如何幫助您改進聊天解決方案。本章還列出了 Amazon Q 商業版支援的文件型別。

文件屬性

每個文件都附加有關於自身的資訊,例如標題、作者、建立日期、上次更新時間和文件型別。

Amazon Q 商業版索引允許您將文件屬性連線到欄位。這些欄位幫助管理員改進來自特定來源的搜尋結果。終端使用者還可以使用這些欄位過濾和縮小搜尋結果。

在聊天中使用文件屬性進行過濾僅支援透過 API 進行。使用文件屬性提升搜尋結果在控制檯和 API 上都受支援。

文件屬性型別

Amazon Q 商業版支援兩種型別的文件屬性。

保留的文件屬性

Amazon Q 商業版具有**保留的或預設的文件屬性**,用於建立常用文件屬性的對映,以幫助您高效地索引文件。

Amazon Q 商業版提供以下保留的文件屬性或索引欄位,您可以將元資料對映到這些欄位:

  • _authors: 負責文件內容的一位或多位作者的列表。
  • _category: 將文件放在特定組中的類別。
  • _created_at: 文件建立的日期和時間(ISO 8601 格式)。例如,2012-03-25T12:30:10+01:00 是 2012 年 3 月 25 日下午 12:30(加 10 秒)中歐時間的 ISO 8601 日期時間格式。
  • _data_source_id: 包含文件的資料來源的識別符號。
  • _document_body: 文件的內容。
  • _document_id: 文件的唯一識別符號。
  • _document_title: 文件的標題。
  • _file_type: 文件的檔案型別,例如 .pdf 或 .docx。
  • _last_updated_at: 文件上次更新的日期和時間(ISO 8601 格式)。例如,2012-03-25T12:30:10+01:00 是 2012 年 3 月 25 日下午 12:30(加 10 秒)中歐時間的 ISO 8601 日期時間格式。
  • _source_uri: 文件可用的 URI。例如,公司網站上文件的 URI。
  • _version: 文件特定版本的識別符號。
  • _view_count: 文件已被檢視的次數。
  • _language_code (字串): 應用於文件的語言程式碼。如果您未指定語言,則預設為英語。

自定義文件屬性

自定義屬性用於將文件中的唯一資訊連結到索引欄位。

您可以根據自己的資料建立自定義屬性,並將它們對映到自定義索引欄位,從而為終端使用者建立更量身定製的聊天體驗。

例如,您可以建立一個名為“部門”的自定義欄位或屬性,其值為“人力資源”、“銷售”和“製造”。然後,您可以使用這些欄位或屬性允許您的終端使用者將聊天結果過濾到“人力資源”部門的文件,或將響應生成限制到特定的資料儲存。

建立後,您無法刪除或重新命名任何屬性。

已對映的文件屬性

當您將文件屬性對映到索引欄位時,您可以決定該欄位在聊天期間如何使用。目前,您可以將索引欄位配置為執行以下操作:

  • 搜尋: 允許終端使用者搜尋具有指定屬性的資料。

文件屬性資料型別

文件屬性(保留的或自定義的)只能是下表中顯示的資料型別。此外,文件屬性可用於執行概述的操作。

資料型別 可搜尋的 可過濾的 可提升的
日期
數字
字串
字串列表
建立索引欄位後,您無法更改其型別。

將文件屬性對映到索引欄位

將文件屬性直接對映到索引欄位。在使用 API 進行聊天過濾之前,請將您的文件屬性對映到索引欄位。

  • 您可以透過呼叫 CreateIndex API 操作來建立索引。
  • 然後,使用**UpdateIndex**操作建立索引欄位。在這裡,您可以將文件詳細資訊連結到索引欄位。
  • 使用**BatchPutDocument**將文件新增到索引中。Amazon Q 商業版會將文件詳細資訊與索引欄位匹配。

使用 API 將文件屬性對映到索引欄位後。然後,選擇要用於過濾聊天響應的屬性。使用**UpdateIndex** API 新增自定義欄位。

以下 JSON 示例使用 documentAttributeConfigurations 將名為“部門”的欄位新增到索引。

"DocumentmetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE"
   }
]

將資料來源對映到索引欄位

將資料來源文件屬性對映到索引欄位。如果您使用 Amazon Q 商業版資料來源聯結器,您可以將預設文件屬性對映到索引欄位。這些屬性有助於使用者過濾和縮小聊天響應。

在聊天中使用資料來源文件屬性進行過濾僅支援透過 API 進行。

資料來源聯結器會自動查詢預設文件屬性。您可以將這些屬性對映到索引欄位。例如,將“dept”欄位對映到“Department”索引欄位。注意:一旦預設屬性被對映,您就無法更改它們。

您還可以對映任何 Amazon Q 商業版保留欄位,例如**_created_at**。如果您的資料來源具有名為**creation_date**的欄位,您可以將此欄位對映到名為 _created_at 的等效 Amazon Q 保留欄位。

您可以新增自定義文件屬性並將它們對映到自定義索引欄位。大多數資料來源允許欄位對映,但 Amazon S3 和資料庫資料來源除外。這兩個具有特殊的對映配置。以下是 Amazon S3 和資料庫資料來源配置對映的方式:

  • 如果您將文件儲存在 Amazon S3 中,您可以透過兩種方式對映欄位。您可以使用控制檯指定欄位對映,也可以使用 JSON 元資料檔案。要向文件新增元資料,請建立一個包含元資料 JSON 檔案的目錄結構以及您的文件。然後,在 Attributes JSON 結構中,您可以新增多達 50 個自定義欄位或屬性。
  • 以下示例使用 Attributes 定義三個自定義欄位或屬性和一個保留欄位。

    "Attributes": {
        "brand": "Amazon Basics",
        "price": 1595,
        "_category": "sports",
        "subcategories": ["outdoors", "electronics"]
    }
    
  • 如果資料庫列的名稱與保留欄位相同,則它們會自動連線。

在設定聯結器時,您可以透過兩種方式對映欄位。在控制檯中,您可以選擇預設欄位對映或建立自定義欄位對映,但請注意,某些預設欄位無法編輯,並且將顯示為灰色。或者,您可以使用 API 對映欄位,在其中使用 CreateDataSource 操作對映預設屬性,並使用 UpdateIndex 操作建立和對映自定義欄位。

使用 BatchPutDocument API 操作匯入屬性

當使用 BatchPutDocument API 將文件新增到索引時,您可以指定屬性,包括保留屬性和自定義屬性。您可以在單個 API 呼叫中新增多個欄位或屬性,最多可新增 50 個自定義欄位。

"Attributes": 
{
    "Department": "HR",
    "_category": "Vacation policy"
}
廣告
© . All rights reserved.