ASCII 與 UNICODE
ASCII 和 UNICODE 是計算機系統中兩種最廣泛使用的字元編碼方案。ASCII 和 UNICODE 之間最根本的區別在於,ASCII 用於以符號、數字和字元的形式表示文字,而 UNICODE 用於交換、處理和儲存任何語言的文字資料。
什麼是 ASCII?
ASCII 代表 美國資訊交換標準程式碼 (American Standard Code for Information Interchange)。它是一個為電子通訊中字元編碼而制定的標準。ASCII 最初發佈於 1963 年。在計算機和其他電子系統中,它用於將文字表示為符號、字元和數字。
在 ASCII 中,每個字母都分配一個 0 到 127 之間的特定值。因此,ASCII 可以用來表示 128 個字元。大多數計算機系統使用 ASCII 編碼方案,這使得不同裝置之間的資料交換變得簡單。
下表顯示了一些符號及其 ASCII 值。
| 名稱 | 符號 | ASCII 值 | 二進位制程式碼 |
|---|---|---|---|
| 空字元 | NUL | 0 | 00000000 |
| 標題開始 | SOH | 1 | 00000001 |
| 替換 | SUB | 26 | 00011010 |
| 轉義 | ESC | 27 | 00011011 |
| 檔案分隔符 | FS | 28 | 00011100 |
| 組分隔符 | GS | 29 | 00011101 |
| 記錄分隔符 | RS | 30 | 00011110 |
| 單元分隔符 | US | 31 | 00011111 |
| 空格 | 32 | 00100000 | |
| 感嘆號 | ! | 33 | 00100001 |
| 雙引號 | " | 34 | 00100010 |
| 數字符號 | # | 35 | 00100011 |
| 美元符號 | $ | 36 | 00100100 |
| 百分號 | % | 37 | 00100101 |
| 和號 | & | 38 | 00100110 |
| 單引號 | ' | 39 | 00100111 |
| 左括號 | ( | 40 | 00101000 |
| 右括號 | ) | 41 | 00101001 |
| 星號 | * | 42 | 00101010 |
| 加號 | + | 43 | 00101011 |
| 逗號 | , | 44 | 00101100 |
| 連字元 | - | 45 | 00101101 |
| 句點 | . | 46 | 00101110 |
| 斜槓 | / | 47 | 00101111 |
| 零 | 0 | 48 | 00110000 |
| 一 | 1 | 49 | 00110001 |
| 二 | 2 | 50 | 00110010 |
| 八 | 8 | 56 | 00111000 |
| 九 | 9 | 57 | 00111001 |
| 冒號 | : | 58 | 00111010 |
| 分號 | ; | 59 | 00111011 |
| 小於號 | < | 60 | 00111100 |
| 等於號 | = | 61 | 00111101 |
| 大於號 | > | 62 | 00111110 |
| 問號 | ? | 63 | 00111111 |
| @ 符號 | @ | 64 | 01000000 |
| 大寫 A | A | 65 | 01000001 |
| 大寫 B | B | 66 | 01000010 |
| 大寫 C | C | 67 | 01000011 |
| 大寫 D | D | 68 | 01000100 |
| 大寫 X | X | 88 | 01011000 |
| 大寫 Y | Y | 89 | 01011001 |
| 大寫 Z | Z | 90 | 01011010 |
| 左方括號 | [ | 91 | 01011011 |
| 反斜槓 | \ | 92 | 01011100 |
| 右方括號 | ] | 93 | 01011101 |
| 脫字元 | ^ | 94 | 01011110 |
| 下劃線 | _ | 95 | 01011111 |
| 重音符 | ` | 96 | 01100000 |
| 小寫 a | a | 97 | 01100001 |
| 小寫 b | b | 98 | 01100010 |
| 小寫 c | c | 99 | 01100011 |
| 小寫 d | d | 100 | 01100100 |
| 小寫 e | e | 101 | 01100101 |
| 小寫 v | v | 118 | 01110110 |
| 小寫 w | w | 119 | 01110111 |
| 小寫 x | x | 120 | 01111000 |
| 小寫 y | y | 121 | 01111001 |
| 小寫 z | z | 122 | 01111010 |
| 左花括號 | { | 123 | 01111011 |
| 豎線 | | | 124 | 01111100 |
| 右花括號 | } | 125 | 01111101 |
| 波浪號 | ~ | 126 | 01111110 |
| 刪除 | 127 | 01111111 |
什麼是 UNICODE?
UNICODE 代表 統一字元集 (Universal Character Set)。UNICODE 是一種編碼方案,其標準由 UNICODE 協會 (UNICODE Consortium) 維持。UNICODE 最大的優點是我們可以透過賦予不同的數字來唯一地定義每種語言中的每個字元。
UNICODE 表示來自不同語言的各種字元、公式、文字、數學符號、表情符號、希臘字母等。因此,UNICODE 是編碼許多全球常用字元的最流行的編碼方案之一。
根據使用的位數,UNICODE 編碼方案分為幾種型別。這些 UNICODE 編碼方案包括 UTF-7(7 位編碼方案)、UTF-8(8 位編碼方案)、UTF-16(16 位編碼方案)和 UTF-32(32 位編碼方案)。這裡,UTF 代表 UNICODE 轉換格式 (UNICODE Transformation Format),這是一種 UNICODE 編碼方案。
使用 UNICODE 的主要目標是計算機應用程式和軟體的本地化和國際化。UNICODE 也用於作業系統的程式設計、Java 應用程式、XML 等。
ASCII 和 UNICODE 之間的區別
以下是 ASCII 和 UNICODE 之間所有重要區別的重點 −
| 引數 | ASCII | UNICODE |
|---|---|---|
| 全稱 | ASCII 代表美國資訊交換標準程式碼 (American Standard Code for Information Interchange)。 | UNICODE 代表統一字元集 (Universal Character Set)。 |
| 相互關係 | ASCII 是 UNICODE 編碼方案的子集。 | UNICODE 是 ASCII 的超集。 |
| 支援的字元 | ASCII 使用 7 位編碼方案僅支援 128 個字元。它包含表示英文字元、數字和標準特殊符號的程式碼。 | UNICODE 支援廣泛的字元。它支援 154 種書寫文字。 |
| 每個字元的位數 | ASCII 使用 7 位或 8 位(擴充套件 ASCII)來表示不同的字元。 | UNICODE 主要使用四種字元編碼方案,即 UTF-7(7 位)、UTF-8(8 位)、UTF-16(16 位)和 UTF-32(32 位)。 |
| 記憶體消耗 | ASCII 消耗的記憶體較少。 | 與 ASCII 相比,UNICODE 消耗的記憶體更多。 |
| 表示的字元 | ASCII 只能表示英文字母、數字、某些數學符號和一些語法符號等。 | UNICODE 可以表示來自不同語言(如英語、拉丁語、希臘語等)的大量字元、特殊符號、公式等。 |
| 首版發行 | ASCII 的首版於 1963 年釋出。 | UNICODE 的首版於 1991 年釋出。 |
| 應用 | ASCII 編碼方案用於計算機和其他電子裝置中的資料交換。它也用於 HTML 等程式語言。 | UNICODE 被 IT 行業用於計算機中的編碼和字元表示。 |
結論
ASCII 和 UNICODE 都是電子通訊中使用的字元編碼方案。從以上對 ASCII 和 UNICODE 的比較中,我們可以指出它們之間最顯著的區別:ASCII 是一種基本的編碼方案,使用 7 位編碼表示 128 個字元,而 UNICODE 則是文字、數字、數學符號、表情符號、公式等的廣闊海洋,可以用不同的位數來對映。但是,ASCII 是 UNICODE 的一個真子集,因此 UNICODE 可以表示 ASCII 中的所有字元。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP