Beautiful Soup - stripped_strings 屬性



方法描述

Tag/Soup 物件的 stripped_strings 屬性返回的結果與 strings 屬性類似,區別在於它去除了額外的換行符和空格。因此,可以說 stripped_strings 屬性會生成一個 NavigableString 物件的生成器,這些物件屬於正在使用的物件的內部元素。

語法

Tag.stripped_strings

示例 1

在下面的示例中,在應用剝離後,顯示了 BeautifulSoup 物件中解析的文件樹中所有元素的字串。

from bs4 import BeautifulSoup, NavigableString

markup = '''
   <div id="Languages">
      <p>Java</p> <p>Python</p> <p>C++</p>
   </div>
'''
soup = BeautifulSoup(markup, 'html.parser')
print ([string for string in soup.stripped_strings])

輸出

['Java', 'Python', 'C++']

與 strings 屬性的輸出相比,您可以看到換行符和空格被去除了。

示例 2

在這裡,我們提取 <div> 標籤下每個子元素的 NavigableStrings。

tag = soup.div

navstrs = tag.stripped_strings
for navstr in navstrs:
   print (navstr)

輸出

Java
Python
C++
廣告