BeautifulSoupで不要なタグをdecomposeで削除する
以下のような構造で、em タブを除去したい場合。
<div class='text'>
<em>12345</em>
日本
</div>
decomposeを使って除去できる。
from bs4 import BeautifulSoup as bs4
soup = bs4(open('./test.html'), 'html.parser')
el = soup.find(class_='region')
el.find('em').decompose()
return el.getText()
「日本」というテキストだけ取得できる。
ディスカッション
コメント一覧
まだ、コメントがありません