ホームページ  >  記事  >  ウェブフロントエンド  >  Beautifulsoup4 の説明、HTML パーサーです。使用方法は次のとおりです: _html/css_WEB-ITnose

Beautifulsoup4 の説明、HTML パーサーです。使用方法は次のとおりです: _html/css_WEB-ITnose

WBOY
WBOYオリジナル
2016-06-24 11:40:391098ブラウズ

Beautifulsoup4 の説明、HTML パーサーです。使用法は次のとおりです:
soup = BeautifulSoup(html_doc)
printSoup.title //特定の要素を取得します
printSoup.title.name //A の特定の要素を取得します特定の要素の属性
printSoup.title.string //要素の下のテキストの取得は、soup.title.get_text()
printSoup.p
printSoup.a
printSoup.find_all('a')と同じ機能があります。 // 要素名または属性値に基づいて、指定されたすべての要素を検索します
printSoup.find(id='link3')//要素名または属性値に基づいて最初に一致する要素を検索します
printSoup.get_text()//特定の要素の下のテキストを取得します

6.feedparser の使用手順。URL シードを解析し、コンテンツを分類し、辞書を作成し、オブジェクト化します。 使用方法は次のように紹介されます。
import feedparser
llog = feedparser.parse( "http:// languagelog.ldc.upenn.edu/nll/?feed=atom")
llog['feed']['title'] llog.feed.title に相当するシードのタイトルを取得します

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。