Beautiful Soup - strings 屬性



方法描述

對於任何擁有多個子元素的PageElement,可以使用strings屬性獲取每個子元素的內部文字。與string屬性不同,strings屬性處理元素包含多個子元素的情況。strings屬性返回一個生成器物件。它會產生一系列對應於每個子元素的NavigableStrings。

語法

Tag.strings

示例1

您可以檢索soup以及標籤物件的strings屬性的值。在下面的示例中,檢查了soup物件的strings屬性。

from bs4 import BeautifulSoup, NavigableString

markup = '''
   <div id="Languages">
      <p>Java</p> <p>Python</p> <p>C++</p>
   </div>
'''
soup = BeautifulSoup(markup, 'html.parser')
print ([string for string in soup.strings])

輸出

['\n', '\n', 'Java', ' ', 'Python', ' ', 'C++', '\n', '\n']

請注意列表中的換行符和空格。我們可以使用stripped_strings屬性刪除它們。

示例2

我們現在獲得`

`標籤的strings屬性返回的生成器物件。使用迴圈,我們列印字串。

tag = soup.div

navstrs = tag.strings
for navstr in navstrs:
   print (navstr)

輸出

Java
 
Python
 
C++

請注意,輸出中出現了換行符和空格,可以使用stripped_strings屬性將其刪除。

廣告
© . All rights reserved.