jsoup - 解析正文



以下示例將展示如何解析 HTML 片段 String 並將其作為 html 正文解析成 Element 物件。

語法

Document document = Jsoup.parseBodyFragment(html);
Element body = document.body();

其中

  • document − 文件物件表示 HTML DOM。

  • Jsoup − 解析給定的 HTML String 的主要類。

  • html − HTML 片段 String。

  • body − 表示文件正文元素的子元素,相當於 document.getElementsByTag("body").

描述

parseBodyFragment(String html) 方法將輸入的 HTML 解析成一個新的 Document。這個文件物件可用於遍歷和獲取 html 正文片段的詳細資訊。

示例

使用你選擇的任意編輯器(例如 C:/> jsoup)建立以下 java 程式。

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<div><p>Sample Content</p>";
      Document document = Jsoup.parseBodyFragment(html);
      Element body = document.body();
      Elements paragraphs = body.getElementsByTag("p");
      for (Element paragraph : paragraphs) {
         System.out.println(paragraph.text());
      }
   }
}

驗證結果

使用 javac 編譯器編譯該類,如下所示

C:\jsoup>javac JsoupTester.java

現在執行 JsoupTester 以檢視結果。

C:\jsoup>java JsoupTester

檢視結果。

Sample Content
廣告
© . All rights reserved.