Python Unicode 資料庫

unicodedata 模組用於透過 Unicode 字元資料庫訪問所有 Unicode 字元。在此資料庫中，包含所有字元的字元屬性。

要使用此模組，我們需要在程式碼中匯入 **unicodedata** 模組。

import unicodedata

Unicode 資料庫方法

這裡描述了 unicodedata 模組的一些方法。

方法 (unicodedata.lookup(name)) −

此方法用於按名稱查詢字元。當名稱有效時，它應該返回該字元。否則，它將引發 KeyError。

方法 (unicodedata.name(chr[, default]))−

此方法用於將給定字元的名稱作為字串返回。如果給出了預設值，則當字元不在資料庫中時，它可能會返回預設值，否則它將引發 ValueError。

方法 (unicodedata.digit(chr[, default])) −

此方法用於返回給定字元的整數數字。如果給出了預設值，則當字元不存在或在資料庫中格式不正確時，它可能會返回預設值，否則它將引發 ValueError。

方法 (unicodedata.category(chr)) −

此方法用於返回分配給字元的通用類別。例如，對於字母，它將返回“L”，對於大寫字母，它將返回“u”，對於左括號，它將返回 Ps（標點開始）等。

方法 (unicodedata.mirrored(chr))−

此方法用於檢查字元是否有映象字元。一些字元有映象字元，例如“（”和“）”等。當它與映象字元匹配時，它將返回 1，否則返回 0。

示例程式碼

import unicodedata as ud
print(ud.lookup('ASTERISK'))
print(ud.lookup('Latin Capital letter G'))

#The Unicode name from the characters
print(ud.name(u'x'))
print(ud.name(u'°'))

#The Unicode character to decimal and numerics
print(ud.decimal(u'6'))
print(ud.numeric(u'9'))

#The Unicode character categoty
print(ud.category(u'A'))
print(ud.category(u'9'))
print(ud.category(u'[')) #Punctuation Start

#Unicode character to check whether mirrored or not
print(ud.mirrored(u'A'))
print(ud.mirrored(u'<'))

輸出

*
G
LATIN SMALL LETTER X
DEGREE SIGN
6
9.0
Lu
Nd
Ps
0
1

Arjun Thakur

更新於: 2019年7月30日

381 次瀏覽

開啟你的職業生涯

透過完成課程獲得認證

立即開始

Python Unicode 資料庫

Unicode 資料庫方法

示例程式碼

輸出

開啟你的 職業生涯

開啟你的職業生涯