XML - 編碼



編碼即將 Unicode 字元轉換為其等效的二進位制表示的過程。XML 處理器在讀取 XML 文件時,它會根據編碼型別對文件進行編碼。因此,我們需在 XML 宣告中指定編碼型別。

編碼型別

編碼型別主要有兩種 -

  • UTF-8
  • UTF-16

UTF 表示UCS 轉換格式,而 UCS 本身表示通用字元集。數字 8 或 16 表示用於表示字元的位數。它們為 8(1 至 4 個位元組)或 16(2 或 4 個位元組)。對於沒有編碼資訊的文件,預設情況下會設定 UTF-8。

語法

編碼型別包含在 XML 文件的前言中。UTF-8 編碼的語法如下 -

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>

UTF-16 編碼的語法如下 -

<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>

示例

以下示例顯示編碼的宣告 -

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

在上述示例中,encoding="UTF-8" 指明使用 8 位來表示字元。要表示 16 位字元,可以使用 UTF-16 編碼。

使用 UTF-8 編碼的 XML 檔案往往比使用 UTF-16 格式編碼的檔案要小。

廣告