XML 字元實體



本章描述了 XML **字元實體**。在理解字元實體之前,讓我們首先了解什麼是 XML 實體。

正如 W3C 聯盟 所述,實體的定義如下:

“文件實體作為實體樹的根和 XML 處理器的起點”。

這意味著實體是 XML 中的佔位符。這些可以在文件序言或 DTD 中宣告。有不同型別的實體,本章將討論字元實體。

HTML 和 XML 都有一些為其自身用途保留的符號,這些符號不能用作 XML 程式碼中的內容。例如,**<** 和 **>** 符號用於開啟和關閉 XML 標籤。要顯示這些特殊字元,可以使用字元實體。

有一些特殊字元或符號無法直接從鍵盤輸入。字元實體也可用於顯示這些符號/特殊字元。

字元實體的型別

字元實體有三種類型:

  • 預定義字元實體
  • 編號字元實體
  • 命名字元實體

預定義字元實體

引入它們是為了避免在使用某些符號時出現歧義。例如,當小於 (**<**) 或大於 (**>**) 符號與角標籤 (**<>**) 一起使用時,會觀察到歧義。字元實體基本上用於在 XML 中分隔標籤。以下是 XML 規範中預定義字元實體的列表。這些可以用來表達字元而不會產生歧義。

  • 和號 − **&amp;**

  • 單引號 − **&apos;**

  • 大於號 − **&gt;**

  • 小於號 − **&lt;**

  • 雙引號 − **&quot;**

數字字元實體

數字引用用於引用字元實體。數字引用可以是十進位制或十六進位制格式。由於有數千個可用的數字引用,這些數字有點難以記住。數字引用透過其在 Unicode 字元集中的編號來指代字元。

十進位制數字引用的通用語法為:

&# decimal number ;

十六進位制數字引用的通用語法為:

&#x Hexadecimal number ;

下表列出了一些預定義的字元實體及其數值:

實體名稱 字元 十進位制引用 十六進位制引用
quot " &#34; &#x22;
amp & &#38; &#x26;
apos ' &#39; &#x27;
lt < &#60; &#x3C;
gt > &#62; &#x3E;

命名字元實體

由於很難記住數字字元,因此最常用的字元實體型別是命名字元實體。在這裡,每個實體都用一個名稱標識。

例如:

  • “Aacute”代表帶重音符的大寫字元。

  • “ugrave”代表帶重音符的小寫字元。

廣告