import requests
res=requests.get('http://news.sina.com.cn/china/')
res.encoding="utf-8"
from bs4 import BeautifulSoup
soup=BeautifulSoup(res.text,'html.parser')
a=soup.select('a')
for i in a:
print (i[href])
我想要输出每个链接的网址,但是上面的代码 结果是
错误:print (i[href])
NameError: name 'href' is not defined
巴扎黑2017-05-24 11:37:29
首先字典的 key 需要引号, print(i['href'])
你可以用 print(i.get('href')
,防止找不到这个元素的时候报 KeyError
。
https://docs.python.org/3/lib...
仅有的幸福2017-05-24 11:37:29
import requests
from bs4 import BeautifulSoup
res = requests.get('http://news.sina.com.cn/china/')
res.encoding = "utf-8"
soup = BeautifulSoup(res.text, 'html.parser')
a = soup.select('a')
for i in a:
try:
href = i['href']
if 'http' in href:
print(href)
except KeyError:
continue
给个建议:问问题的时候尽量把自己的疑问说出来。你这里主要是 i['href']
没加单引号