ASCII 與 UNICODE


ASCIIUNICODE 是計算機系統中兩種最廣泛使用的字元編碼方案。ASCII 和 UNICODE 之間最根本的區別在於,ASCII 用於以符號、數字和字元的形式表示文字,而 UNICODE 用於交換、處理和儲存任何語言的文字資料。

什麼是 ASCII?

ASCII 代表 美國資訊交換標準程式碼 (American Standard Code for Information Interchange)。它是一個為電子通訊中字元編碼而制定的標準。ASCII 最初發佈於 1963 年。在計算機和其他電子系統中,它用於將文字表示為符號、字元和數字。

在 ASCII 中,每個字母都分配一個 0 到 127 之間的特定值。因此,ASCII 可以用來表示 128 個字元。大多數計算機系統使用 ASCII 編碼方案,這使得不同裝置之間的資料交換變得簡單。

下表顯示了一些符號及其 ASCII 值。

名稱 符號 ASCII 值 二進位制程式碼
空字元 NUL 0 00000000
標題開始 SOH 1 00000001
替換 SUB 26 00011010
轉義 ESC 27 00011011
檔案分隔符 FS 28 00011100
組分隔符 GS 29 00011101
記錄分隔符 RS 30 00011110
單元分隔符 US 31 00011111
空格 32 00100000
感嘆號 ! 33 00100001
雙引號 " 34 00100010
數字符號 # 35 00100011
美元符號 $ 36 00100100
百分號 % 37 00100101
和號 & 38 00100110
單引號 ' 39 00100111
左括號 ( 40 00101000
右括號 ) 41 00101001
星號 * 42 00101010
加號 + 43 00101011
逗號 , 44 00101100
連字元 - 45 00101101
句點 . 46 00101110
斜槓 / 47 00101111
0 48 00110000
1 49 00110001
2 50 00110010
8 56 00111000
9 57 00111001
冒號 : 58 00111010
分號 ; 59 00111011
小於號 < 60 00111100
等於號 = 61 00111101
大於號 > 62 00111110
問號 ? 63 00111111
@ 符號 @ 64 01000000
大寫 A A 65 01000001
大寫 B B 66 01000010
大寫 C C 67 01000011
大寫 D D 68 01000100
大寫 X X 88 01011000
大寫 Y Y 89 01011001
大寫 Z Z 90 01011010
左方括號 [ 91 01011011
反斜槓 \ 92 01011100
右方括號 ] 93 01011101
脫字元 ^ 94 01011110
下劃線 _ 95 01011111
重音符 ` 96 01100000
小寫 a a 97 01100001
小寫 b b 98 01100010
小寫 c c 99 01100011
小寫 d d 100 01100100
小寫 e e 101 01100101
小寫 v v 118 01110110
小寫 w w 119 01110111
小寫 x x 120 01111000
小寫 y y 121 01111001
小寫 z z 122 01111010
左花括號 { 123 01111011
豎線 | 124 01111100
右花括號 } 125 01111101
波浪號 ~ 126 01111110
刪除 127 01111111

什麼是 UNICODE?

UNICODE 代表 統一字元集 (Universal Character Set)。UNICODE 是一種編碼方案,其標準由 UNICODE 協會 (UNICODE Consortium) 維持。UNICODE 最大的優點是我們可以透過賦予不同的數字來唯一地定義每種語言中的每個字元。

UNICODE 表示來自不同語言的各種字元、公式、文字、數學符號、表情符號、希臘字母等。因此,UNICODE 是編碼許多全球常用字元的最流行的編碼方案之一。

根據使用的位數,UNICODE 編碼方案分為幾種型別。這些 UNICODE 編碼方案包括 UTF-7(7 位編碼方案)、UTF-8(8 位編碼方案)、UTF-16(16 位編碼方案)和 UTF-32(32 位編碼方案)。這裡,UTF 代表 UNICODE 轉換格式 (UNICODE Transformation Format),這是一種 UNICODE 編碼方案。

使用 UNICODE 的主要目標是計算機應用程式和軟體的本地化和國際化。UNICODE 也用於作業系統的程式設計、Java 應用程式、XML 等。

ASCII 和 UNICODE 之間的區別

以下是 ASCII 和 UNICODE 之間所有重要區別的重點 −

引數 ASCII UNICODE
全稱 ASCII 代表美國資訊交換標準程式碼 (American Standard Code for Information Interchange)。 UNICODE 代表統一字元集 (Universal Character Set)。
相互關係 ASCII 是 UNICODE 編碼方案的子集。 UNICODE 是 ASCII 的超集。
支援的字元 ASCII 使用 7 位編碼方案僅支援 128 個字元。它包含表示英文字元、數字和標準特殊符號的程式碼。 UNICODE 支援廣泛的字元。它支援 154 種書寫文字。
每個字元的位數 ASCII 使用 7 位或 8 位(擴充套件 ASCII)來表示不同的字元。 UNICODE 主要使用四種字元編碼方案,即 UTF-7(7 位)、UTF-8(8 位)、UTF-16(16 位)和 UTF-32(32 位)。
記憶體消耗 ASCII 消耗的記憶體較少。 與 ASCII 相比,UNICODE 消耗的記憶體更多。
表示的字元 ASCII 只能表示英文字母、數字、某些數學符號和一些語法符號等。 UNICODE 可以表示來自不同語言(如英語、拉丁語、希臘語等)的大量字元、特殊符號、公式等。
首版發行 ASCII 的首版於 1963 年釋出。 UNICODE 的首版於 1991 年釋出。
應用 ASCII 編碼方案用於計算機和其他電子裝置中的資料交換。它也用於 HTML 等程式語言。 UNICODE 被 IT 行業用於計算機中的編碼和字元表示。

結論

ASCII 和 UNICODE 都是電子通訊中使用的字元編碼方案。從以上對 ASCII 和 UNICODE 的比較中,我們可以指出它們之間最顯著的區別:ASCII 是一種基本的編碼方案,使用 7 位編碼表示 128 個字元,而 UNICODE 則是文字、數字、數學符號、表情符號、公式等的廣闊海洋,可以用不同的位數來對映。但是,ASCII 是 UNICODE 的一個真子集,因此 UNICODE 可以表示 ASCII 中的所有字元。

更新於:2023年3月14日

瀏覽量:10K+

啟動您的 職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.