Python正則表示式中字元類內部的元字元是什麼?


大多數字母和字元本身就匹配自身。但是,有一些字元稱為元字元,它們不匹配自身。相反,它們指示應該匹配某種模式,或者重複或更改正則表示式的部分內容。

以下是元字元的完整列表

. ^ $ * + ? { } [ ] \ | ( )

首先,我們將看看`[`和`]`。它們用於指示字元類,它是一組要匹配的字元。字元可以單獨列出,或者可以透過給出兩個字元並用“-”分隔它們來指示字元範圍。例如,`[xyz]`將匹配字元x、y或z中的任何一個;這與`[x-z]`相同,後者使用範圍來表示相同的字元集。如果只想匹配小寫字母,則正則表示式為`[a-z]`。

元字元在類內不起作用。例如,`[abc$]`將匹配'a'、'b'、'c'或'$'中的任何一個字元;'$'是一個元字元,但在字元類內部,它失去了其特殊含義。

如果類中的第一個字元是`^`,則表示所有不是此類的字元;例如,`[^8]`將匹配除'8'之外的任何字元。

也許最重要的元字元是反斜槓`\`。它也用於轉義所有元字元,因此您仍然可以在模式中匹配它們;例如,如果您需要匹配`]`或`\`,您可以用反斜槓在它們前面來移除它們的特殊含義:`]`或`\\`。

更新於:2020年6月13日

344 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始學習
廣告