
- Jsoup 教程
- jsoup - 主頁
- jsoup - 概述
- jsoup - 環境設定
- 示例 - 輸入
- jsoup - 解析字串
- jsoup - 解析正文
- jsoup - 載入 URL
- jsoup - 載入檔案
- 示例 - 提取資料
- jsoup - 使用 DOM 方法
- jsoup - 使用選擇器語法
- jsoup - 提取屬性
- jsoup - 提取文字
- jsoup - 提取 HTML
- jsoup - 使用 URL
- 示例 - 修改資料
- jsoup - 設定屬性
- jsoup - 設定 HTML
- jsoup - 設定文字內容
- 示例 - 清除 HTML
- jsoup - 清除 HTML
- jsoup 有用資源
- jsoup - 快速指南
- jsoup - 有用資源
- jsoup - 討論
jsoup - 提取文字
以下示例將展示使用在解析 HTML 字串為 Document 物件後獲取文字的方法。
語法
Document document = Jsoup.parse(html); Element link = document.select("a").first(); System.out.println("Text: " + link.text());
其中
document − document 物件表示 HTML DOM。
Jsoup − 解析給定的 HTML 字串的主類。
html − HTML 字串。
link − 元素物件表示代表錨定標記的 HTML 節點元素。
link.text() − text() 方法檢索元素文字。
說明
Element 物件表示 DOM 元素,並提供各種方法以獲取 DOM 元素的文字。
示例
在 C:/> jsoup 中使用任意編輯器建立以下 Java 程式。
JsoupTester.java
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class JsoupTester { public static void main(String[] args) { String html = "<html><head><title>Sample Title</title></head>" + "<body>" + "<p>Sample Content</p>" + "<div id='sampleDiv'><a href='www.google.com'>Google</a>" + "<h3><a>Sample</a><h3>" +"</div>" +"</body></html>"; Document document = Jsoup.parse(html); //a with href Element link = document.select("a").first(); System.out.println("Text: " + link.text()); } }
驗證結果
使用 javac 編譯器如下編譯該類
C:\jsoup>javac JsoupTester.java
現在執行 JsoupTester 以檢視結果。
C:\jsoup>java JsoupTester
檢視結果。
Text: Google
廣告