- Java 國際化教程
- Java I18N - 首頁
- Java I18N - 概述
- Java I18N - 環境設定
- Locale 類示例
- Java I18N - Locale 類
- Java I18N - Locale 細節
- Java I18N - 顯示語言
- ResourceBundle 類示例
- Java I18N - ResourceBundle 類
- NumberFormat 類示例
- Java I18N - NumberFormat 類
- Java I18N - 格式化貨幣
- Java I18N - 格式化百分比
- Java I18N - 設定最小/最大精度
- Java I18N - 設定舍入模式
- Java I18N - 解析數字
- DecimalFormat 類示例
- Java I18N - DecimalFormat 類
- Java I18N - 格式化模式
- Java I18N - 基於區域設定的 DecimalFormat
- Java I18N - DecimalFormatSymbols 類
- Java I18N - 分組數字
- DateFormat 類示例
- Java Java - DateFormat 類
- Java I18N - 格式化日期
- Java I18N - 格式化時間
- Java I18N - 格式化日期和時間
- SimpleDateFormat 類示例
- Java I18N - SimpleDateFormat 類
- Java I18N - 格式化日期
- Java I18N - DateFormatSymbols 類
- Java I18N - 日期格式模式
- 時區示例
- Java I18N - UTC
- Unicode 轉換
- Java I18N - 字串之間的轉換
- Java I18N - Reader 和 Writer 之間的轉換
- 相關教程
- Java 教程
- JDBC 教程
- Swing 教程
- AWT 教程
- Servlet 教程
- JSP 教程
- Java I18N 有用資源
- Java I18N - 快速指南
- Java I18N - 有用資源
- Java I18N - 討論
Java 國際化 - Unicode 字串轉換
在 Java 中,文字在內部以 Unicode 格式儲存。如果輸入/輸出使用不同的格式,則需要進行轉換。
轉換
以下示例將展示如何將 Unicode 字串轉換為 UTF8 位元組陣列,以及如何將 UTF8 位元組陣列轉換為 Unicode 位元組陣列。
示例
import java.io.UnsupportedEncodingException;
import java.nio.charset.Charset;
import java.text.ParseException;
public class I18NTester {
public static void main(String[] args) throws ParseException, UnsupportedEncodingException {
String unicodeString = "\u00C6\u00D8\u00C5" ;
//convert Unicode to UTF8 format
byte[] utf8Bytes = unicodeString.getBytes(Charset.forName("UTF-8"));
printBytes(utf8Bytes, "UTF 8 Bytes");
//convert UTF8 format to Unicode
String converted = new String(utf8Bytes, "UTF8");
byte[] unicodeBytes = converted.getBytes();
printBytes(unicodeBytes, "Unicode Bytes");
}
public static void printBytes(byte[] array, String name) {
for (int k = 0; k < array.length; k++) {
System.out.println(name + "[" + k + "] = " + array[k]);
}
}
}
輸出
它將列印以下結果。
UTF 8 Bytes[0] = -61 UTF 8 Bytes[1] = -122 UTF 8 Bytes[2] = -61 UTF 8 Bytes[3] = -104 UTF 8 Bytes[4] = -61 UTF 8 Bytes[5] = -123 Unicode Bytes[0] = -58 Unicode Bytes[1] = -40 Unicode Bytes[2] = -59
廣告