Java 中將字串轉換為 UTF-8 位元組


在將字串轉換為 UTF-8 位元組之前,讓我們先了解一下 UTF-8。

UTF-8 是一種可變長度字元編碼。UTF-8 可以像 ASCII 一樣緊湊,但也可以包含任何 Unicode 字元,檔案大小會略微增加。UTF 代表 Unicode 轉換格式。“8”表示它分配 8 位塊來表示一個字元。表示一個字元所需的塊數從 1 到 4 不等。

為了將字串轉換為 UTF-8,我們使用 Java 中的 getBytes() 方法。getBytes() 方法將字串編碼為位元組序列並返回一個位元組陣列。

宣告 − getBytes() 方法宣告如下:

public byte[] getBytes(String charsetName)

其中 charsetName 是將字串編碼為位元組陣列的特定字元集。

讓我們來看一個在 Java 中將字串轉換為 UTF-8 位元組的程式。

示例

 線上演示

public class Example {
   public static void main(String args[]) throws Exception {
      String s = "Hello World";
      byte arr[] = s.getBytes("UTF8");
      for (byte x: arr) {
         System.out.print(x+" ");
      }
   }
}

輸出

72 101 108 108 111 32 87 111 114 108 100

讓我們理解上述程式。我們建立了一個字串 s:

String s = "Hello World";

String s 被賦值為 Hello World。

為了將其轉換為 UTF-8,我們使用 getBytes(“UTF-8”) 方法。這將給我們一個如下所示的位元組陣列:

byte[] arr = s.getBytes("UTF-8");

然後,為了列印位元組陣列,我們使用增強型 for 迴圈:

for (byte x: arr) {
   System.out.print(x+" ");
}

更新於:2020年6月26日

23K+ 次瀏覽

開啟你的職業生涯

透過完成課程獲得認證

開始學習
廣告