如何在 Python 中將 HTML 轉換為 Markdown?


Markdown 是一種輕量級標記語言,允許您編寫格式化的文字,這些文字可以在網路上輕鬆閱讀和理解。另一方面,HTML 是一種用於構建和顯示網路內容的標記語言。將 HTML 文字轉換為 Markdown 在您希望簡化內容或使其更易讀的情況下非常有用。

將 HTML 轉換為 Markdown 的一種方法是使用 Python 中的 markdownify 包。此包提供了一種簡單有效的方法來將 HTML 文字轉換為 Markdown 格式。要開始轉換過程,您需要在 Python 環境中下載並安裝 markdownify 包。安裝完成後,您可以匯入該包並使用其函式將 HTML 文字轉換為 Markdown。

在本文中,我們將提供有關如何在 Python 中下載和安裝 markdownify 包的分步說明,並演示如何使用其函式將 HTML 轉換為 Markdown。在本文結束時,您將清楚地瞭解如何使用 Python 和 markdownify 將 HTML 轉換為 Markdown。

安裝

Python 沒有預裝此模組,因此您需要單獨安裝它。要安裝該模組,請開啟終端並輸入以下命令

pip3 install markdownify

使用 Python 將 HTML 文字轉換為 Markdown 的方法涉及以下幾個步驟:

  • 匯入模組 - 第一步是將 markdownify 模組匯入到您的 Python 指令碼中。此模組提供了一組可用於將 HTML 轉換為 Markdown 的函式。

  • 建立 HTML 文字 - 接下來,您需要建立要轉換為 Markdown 的 HTML 文字。您可以手動輸入此文字,也可以使用 Python 庫(如 requests)從檔案或網頁中讀取它。

  • 使用 markdownify() 函式並將文字傳遞給它 - 獲得 HTML 文字後,您可以使用 markdownify 模組提供的 markdownify() 函式將其轉換為 Markdown。此函式將 HTML 文字作為輸入,並返回等效的 Markdown 文字。

  • 顯示 Markdown 化文字 - 最後,您可以使用 Python 的內建函式在控制檯中顯示 Markdown 文字或將其寫入檔案。

總的來說,此方法包括匯入必要的模組、建立要轉換的 HTML 文字、將其傳遞給 markdownify() 函式以獲取等效的 Markdown 文字,然後顯示或寫入輸出。此過程在您希望將 HTML 內容轉換為 Markdown 以便於閱讀和格式化時非常有用。

示例 1:將 HTML 轉換為 Markdown

現在讓我們專注於程式碼,我們將在此程式碼中將簡單的 html 轉換為 markdown。

考慮以下程式碼。在此程式碼中,我們首先匯入 markdownify 模組。然後,我們建立一些要轉換為 Markdown 的示例 HTML 文字。在這種情況下,我們有一個簡單的 HTML 標題和段落。

接下來,我們使用 markdownify() 函式將 HTML 文字轉換為 Markdown 格式。此函式將 HTML 文字作為輸入,並返回等效的 Markdown 文字。

示例

最後,我們使用 print() 函式顯示轉換後的 Markdown 文字。輸出將是原始 HTML 輸入的等效 Markdown 文字

main.py

# Import markdownify module
import markdownify

# Create HTML text to be converted
html_text = "<h1>My HTML Title</h1><p>This is some sample HTML text.</p>"

# Use markdownify() function to convert HTML to Markdown
markdown_text = markdownify.markdownify(html_text)

# Display the converted Markdown text
print(markdown_text)

輸出

執行後,我們將獲得以下輸出

# Import markdownify module import markdownify # Create HTML text to be converted html_text = "
My HTML Title
This is some sample HTML text.

" # Use markdownify() function to convert HTML to Markdown markdown_text = markdownify.markdownify(html_text) # Display the converted Markdown text print(markdown_text)

示例 2

讓我們再探討一個使用稍微複雜一些的 HTML 程式碼的示例。考慮以下程式碼。

main.py

# Import markdownify module
import markdownify

# Create complex HTML text to be converted
html_text = """
<div class="article">
   <h1>My HTML Title</h1>
   <p>This is some sample HTML text.</p>
   <ul>
      <li>Item 1</li>
      <li>Item 2</li>
      <li>Item 3</li>
   </ul>
   <a href="https://tutorialspoint.tw">Link to TutorialsPoint</a>
</div>
"""
# Use markdownify() function to convert HTML to Markdown
markdown_text = markdownify.markdownify(html_text)

# Display the converted Markdown text
print(markdown_text)

輸出

執行後,我們將獲得以下輸出。

# Import markdownify module import markdownify # Create complex HTML text to be converted html_text = """
My HTML Title
This is some sample HTML text.

Item 1
Item 2
Item 3
Link to TutorialsPoint
""" # Use markdownify() function to convert HTML to Markdown markdown_text = markdownify.markdownify(html_text) # Display the converted Markdown text print(markdown_text)

結論

總之,使用 Python 將 HTML 轉換為 Markdown 可能是格式化和顯示網路內容的一種有用方法。markdownify 模組為此任務提供了一個簡單有效的解決方案,允許您輕鬆地將 HTML 文字轉換為 Markdown 格式。

更新於: 2023-04-18

13K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.