在 Java 中,Unicode、ASCII、UTF-16 和 UTF-8 字元分別使用多少位來表示?


一般來說,資料以位的形式(1 或 0)儲存在計算機中。有各種可用的編碼方案,指定每個字元表示的位元組集。

ASCII - 代表**A**merican **S**tandards **C**ode for **I**nformation **I**nterchange(美國資訊交換標準程式碼)。它由美國標準協會開發,是最常用的編碼系統。它使用 7 位表示字元,包含 128 個字元:大小寫拉丁字母、數字 0-9 和一些額外字元)。

Unicode (UTF) - 代表 Unicode 轉換格式。它由 Unicode Consortium 開發。如果您想建立使用多個字元集的字元的文件,則可以使用單個 Unicode 字元編碼來實現。它提供 3 種類型的編碼。

  • UTF-8 - 它以 8 位單位(位元組)出現,UTF8 中的一個字元可以是 1 到 4 個位元組長,這使得 UTF8 成為可變寬度。
  • UTF-16 - 它以 16 位單位(短整型)出現,它可以是 1 或 2 個短整型長,這使得 UTF16 成為可變寬度。
  • UTF-32 - 它以 32 位單位(長整型)出現。它是一種固定寬度格式,長度始終為 1 個“長整型”。

Java 中的表示

下表列出了 Java 中用於表示各種編碼標準的位數。

表示使用的位數
ASCII7 位(表示為 8 位)。
UTF-88 位、16 位和 18 位模式。
UTF-1616 位和更大的位模式。

更新於: 2019-07-30

2K+ 閱讀量

開啟您的職業生涯

透過完成課程獲得認證

開始學習
廣告