如何在 Java 中從給定的字串中刪除 HTML 標記?
**String **是 Java 中的一個**最終類**,並且它**不可變**,這意味著我們不能夠更改物件本身,但我們可以更改對該物件的引用。可以使用 String 類的**replaceAll()** 方法來從給定字串中移除 HTML 標記。我們可以使用**正則表示式**來從給定的字串中移除 HTML 標記。在從字串中移除 HTML 標記之後,它將返回一個正常的文字字串。
語法
public String replaceAll(String regex, String replacement)
示例
public class RemoveHTMLTagsTest { public static void main(String[] args) { String str = "<p><b>Welcome to Tutorials Point</b></p>"; System.out.println("Before removing HTML Tags: " + str); str = str.replaceAll("\<.*?\>", ""); System.out.println("After removing HTML Tags: " + str); } }
輸出
Before removing HTML Tags: <p><b>Welcome to Tutorials Point</b></p> After removing HTML Tags: Welcome to Tutorials Point
廣告