ホームページ >ウェブフロントエンド >htmlチュートリアル >Beautifulsoup4 の説明、HTML パーサーです。使用方法は次のとおりです: _html/css_WEB-ITnose
Beautifulsoup4 の説明、HTML パーサーです。使用法は次のとおりです:
soup = BeautifulSoup(html_doc)
printSoup.title //特定の要素を取得します
printSoup.title.name //A の特定の要素を取得します特定の要素の属性
printSoup.title.string //要素の下のテキストの取得は、soup.title.get_text()
printSoup.p
printSoup.a
printSoup.find_all('a')と同じ機能があります。 // 要素名または属性値に基づいて、指定されたすべての要素を検索します
printSoup.find(id='link3')//要素名または属性値に基づいて最初に一致する要素を検索します
printSoup.get_text()//特定の要素の下のテキストを取得します
6.feedparser の使用手順。URL シードを解析し、コンテンツを分類し、辞書を作成し、オブジェクト化します。 使用方法は次のように紹介されます。
import feedparser
llog = feedparser.parse( "http:// languagelog.ldc.upenn.edu/nll/?feed=atom")
llog['feed']['title'] llog.feed.title に相当するシードのタイトルを取得します