如何以文字格式從 HTML 標籤中提取文字?
從HTML 檔案中提取文字的行為,基本上等同於將網站內容複製貼上到記事本中。這聽起來很簡單,但如果你需要從數百萬個 HTML 檔案(網頁)中提取文字,那就不會那麼輕鬆愉快了。
讓我們深入瞭解這篇文章,以便更好地理解如何以文字格式從HTML 標籤 中提取文字。
從 HTML 標籤中提取文字
許多HTML 元素 可用於賦予文字特定的含義。為了更好地理解如何以文字格式從 HTML 標籤中提取文字,讓我們看看下面的例子。
示例
在下面的示例中,我們執行指令碼從 HTML 標籤中提取文字。
<!DOCTYPE html>
<html>
<body>
<script>
function gettext(html){
var tempDivElement = document.createElement("div");
tempDivElement.innerHTML = html;
return tempDivElement.textContent || tempDivElement.innerText || "";
}
var sentence= "<div><h1>Welcome to Tutorialspoint</h1></div>";
document.write(gettext(sentence));
</script>
</body>
</html>
指令碼執行後,它將生成一個包含從上述指令碼獲得的資料的輸出,並將其顯示在網頁上。
示例
考慮下面的示例,我們執行指令碼從 HTML 標籤獲取文字。
<!DOCTYPE html>
<html>
<body>
<script>
var statement= "<div><h1>TutorialsPoint</h1>
<p> is the Best E-Learning</p></div>";
var result = statement.replace(/<[^>]+>/g, '');
document.write(result)
</script>
</body>
</html>
執行上述指令碼後,將彈出輸出視窗,其中包含執行指令碼後從網頁中提取的文字。
廣告
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP