html - Python2 BeautifulSoup 提取网页中的表格数据及连接

Question

网址：http://quote.eastmoney.com/ce...要做的是提取网页中的表格数据（如：板块名称，及相应链接下的所有个股，依然是个表格） 暂时只写了这些代码：import urllib2from bs4 import BeautifulSoup url='http://...

天蓬老师 · Answer

因為是非同步加載，資料在這裡
http://nufm.dfcfw.com/EM_Fina...

# coding:utf-8

import requests

r = requests.get('http://nufm.dfcfw.com/EM_Finance2014NumericApplication/JS.aspx?type=CT&cmd=C._BKGN&sty=FPGBKI&st=c&sr=-1&p=1&ps=5000&token=7bc05d0d4c3c22ef9fca8c2a912d779c&v=0.12043042036331286')
data = [_.decode('utf-8').split(',') for _ in eval(r.text)]

url = 'http://quote.eastmoney.com/center/list.html#28003{}_0_2'
lst = [(url.format(_[1].replace('BK0', '')), _[2]) for _ in data]
print lst

html - Python2 BeautifulSoup 提取网页中的表格数据及连接

全部回覆(1)我來回復