Maison > Questions et réponses > le corps du texte
articles=response.css("#content > article:nth-child(5) p")
sgg="";
for item in articles:
sgg = sgg+item.extract()
data=urllib.urlencode({ 'title':title ,"describle":describle,"article":sgg} );
我想把sgg+item.extract() 转换为字符串.转换为urlcode.发送出去.
不过我碰到问题是这个
articles=response.css("#content > article:nth-child(5) p")
for item in articles: print ( type(item.extract()) )
输出
<type 'unicode'>
所以如果
data = {
'title': title,
'describle': describle,
'article': article
}
print urllib.urlencode(data);
就报错了
高洛峰2017-04-17 17:58:29
不知道你说的高效是啥,贴上可读性好一点的代码
articles = response.css("#content > article:nth-child(5) p")
article = ''.join([_.extract() for _ in articles])
data = {
'title': title,
'describle': describle,
'article': article
}
print urllib.urlencode(data);
你再结比一下这段代码
import urllib
data = {
'title': '标题',
'describle': 'abc',
'article': u'中文'.encode('utf-8')
}
print urllib.urlencode(data);