如何以文字格式從 HTML 標籤中提取文字?


HTML 檔案中提取文字的行為,基本上等同於將網站內容複製貼上到記事本中。這聽起來很簡單,但如果你需要從數百萬個 HTML 檔案(網頁)中提取文字,那就不會那麼輕鬆愉快了。

讓我們深入瞭解這篇文章,以便更好地理解如何以文字格式從HTML 標籤 中提取文字。

從 HTML 標籤中提取文字

許多HTML 元素 可用於賦予文字特定的含義。為了更好地理解如何以文字格式從 HTML 標籤中提取文字,讓我們看看下面的例子。

示例

在下面的示例中,我們執行指令碼從 HTML 標籤中提取文字。

<!DOCTYPE html>
<html>
   <body>
      <script>
         function gettext(html){
            var tempDivElement = document.createElement("div");
            tempDivElement.innerHTML = html;
            return tempDivElement.textContent || tempDivElement.innerText || "";
         }
         var sentence= "<div><h1>Welcome to Tutorialspoint</h1></div>";
         document.write(gettext(sentence));
      </script>
   </body>
</html>

指令碼執行後,它將生成一個包含從上述指令碼獲得的資料的輸出,並將其顯示在網頁上。

示例

考慮下面的示例,我們執行指令碼從 HTML 標籤獲取文字。

<!DOCTYPE html>
<html>
   <body>
      <script>
         var statement= "<div><h1>TutorialsPoint</h1>
<p> is the Best E-Learning</p></div>"; var result = statement.replace(/<[^>]+>/g, ''); document.write(result) </script> </body> </html>

執行上述指令碼後,將彈出輸出視窗,其中包含執行指令碼後從網頁中提取的文字。

更新於:2023年11月23日

1K+ 次瀏覽

開啟你的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.