資料/資訊表示



計算機不理解人類語言;它們理解規定的格式內的資料。資料表示是一種表示資料並將其編碼到計算機系統中的方法。通常,使用者輸入數字、文字、影像、音訊和影片等型別的資料進行處理,但計算機首先將這些資料轉換為機器語言,然後對其進行處理。

一些常見的資料表示方法包括:

Methods

資料表示在儲存、處理和資料通訊中起著至關重要的作用。正確有效的資料表示方法會影響資料處理效能和系統相容性。

計算機以以下形式表示資料:

數制

計算機系統將數字視為資料;它包括整數、小數和複數。所有輸入的數字都以二進位制格式(如0和1)表示。數制分為四種類型:

  • 二進位制 - 二進位制數制是數字系統中所有用於資料表示的數字的基礎。二進位制數制僅包含兩個值,0或1;因此它的基數為2。它可以向外部世界表示為(10110010)2。計算機系統使用二進位制數字(0和1)在內部表示資料。
  • 八進位制 - 八進位制數制用8個數字表示值。它包含數字0,1,2,3,4,5,6和7;因此它的基數為8。它可以向外部世界表示為(324017)8
  • 十進位制 - 十進位制數制用10個數字表示值。它包含數字0, 1, 2, 3, 4, 5, 6, 7, 8和9;因此它的基數為10。它可以向外部世界表示為(875629)10
  • 十六進位制數 - 十六進位制數制用16個數字表示值。它包含數字0, 1, 2, 3, 4, 5, 6, 7, 8和9,然後包含字母A, B, C, D, E和F;因此它的基數為16。其中A代表10,B代表11,C代表12,D代表13,E代表14,F代表15。

    下表總結了數制的資料表示及其基數和數字。

數制
系統 基數 數字
二進位制 2 0 1
八進位制 8 0 1 2 3 4 5 6 7
十進位制 10 0 1 2 3 4 5 6 7 8 9
十六進位制 16 0 1 2 3 4 5 6 7 8 9 A B C D E F

位和位元組

位是計算機在計算中使用的最小資料單元;計算機系統完成的所有計算任務都基於位。位表示0或1的二進位制數字。計算機通常成組使用位。它是數字計算中資訊儲存和通訊的基本單元。

位元組

八位一組稱為位元組。半個位元組稱為半位元組;這意味著四位一組稱為半位元組。位元組是計算機記憶體和儲存的基本可定址單元。它可以使用ASCII和Unicode等編碼方法來表示單個字元,例如字母、數字或符號。

位元組用於確定檔案大小、儲存容量和可用記憶體空間。一個千位元組(KB)等於1024位元組,一個兆位元組(MB)等於1024 KB,一個吉位元組(GB)等於1024 MB。檔案大小大致以KB為單位測量,記憶體空間的可用性以MB和GB為單位測量。

Bytes

下表顯示了位和位元組的轉換:

位元組值 位值
1 位元組 8 位
1024 位元組 1 千位元組
1024 千位元組 1 兆位元組
1024 兆位元組 1 吉位元組
1024 吉位元組 1 太位元組
1024 太位元組 1 拍位元組
1024 拍位元組 1 艾位元組
1024 艾位元組 1 澤位元組
1024 澤位元組 1 堯位元組
1024 堯位元組 1 勃位元組
1024 勃位元組 1 喬位元組

文字程式碼

文字程式碼是一種靜態程式碼,允許使用者插入文字,其他人掃描時可以看到。它包括字母、標點符號和其他符號。一些最常用的文字程式碼系統包括:

  • EBCDIC
  • ASCII
  • 擴充套件ASCII
  • Unicode

EBCDIC

EBCDIC代表擴充套件二進位制編碼十進位制交換碼。IBM在20世紀60年代初期開發了EBCDIC,並將其用於其大型機系統,如System/360及其後續系統。為了滿足商業和資料處理的需求,它支援字母、數字、標點符號和特殊符號。字元程式碼將EBCDIC與其他字元編碼方法(如ASCII)區分開來。以EBCDIC或ASCII編碼的資料可能與計算機不相容;為了使它們相容,我們需要進行系統相容性轉換。EBCDIC將每個字元編碼為一個8位二進位制程式碼,並定義256個符號。下表顯示了不同的字元及其EBCDIC程式碼。

EBCDIC

ASCII

ASCII代表美國資訊交換標準程式碼。它是一個8位程式碼,指定字元值從0到127。ASCII是數字字元編碼的標準,它為表示字元分配數值,例如字母、數字、感嘆號和計算機和通訊裝置中使用的控制字元,這些字元使用資料。

ASCII最初定義了128個字元,用7位編碼,允許有2^7(128)個潛在字元。ASCII標準指定了英文字母(大寫和小寫)、數字0到9、標點符號以及用於格式化和控制任務(如換行、回車和製表符)的控制字元。

ASCII表格列
ASCII程式碼 十進位制值 字元
0000 0000 0 空提示
0000 0001 1 標題開始
0000 0010 2 文字開始
0000 0011 3 文字結束
0000 0100 4 傳輸結束
0000 0101 5 詢問
0000 0110 6 確認
0000 0111 7 可聽鈴
0000 1000 8 退格
0000 1001 9 水平製表符
0000 1010 10 換行符

擴充套件ASCII

擴充套件的美國資訊交換標準程式碼是一個8位程式碼,指定字元值從128到255。擴充套件ASCII包含不同的字元編碼標準ASCII字元集,由128個用7位編碼的字元組成,一些額外的字元使用位元組的全部8位;總共有256個潛在字元。

存在不同的擴充套件ASCII,每個都引入了超出傳統ASCII集的更多字元。這些附加字元可能包含特定語言或位置的符號、字母和特殊字元。

擴充套件ASCII表格列

Extended ASCII

Unicode

它是一種全球通用的字元標準,使用4到32位來表示字母、數字和符號。Unicode是一種標準字元編碼,專門設計用於提供一種一致的方式來表示世界上幾乎所有書寫系統中的文字。每個字元都被分配一個唯一的數字程式碼、程式或語言。Unicode提供了各種各樣的字元,包括字母、表意文字、符號和表情符號。

Unicode表格列

Unicode
廣告