我想把房屋概況分別抓出來並分別儲存為獨立的列進字典裡,但是行內元素沒有辦法直接用for迴圈摳出來。
這是我的程式碼:
soup.select('.house-info li')[1].text.strip()
這是網頁html程式碼:
<li><span class="info-tit">房屋概况:</span>住宅
<span class="splitline">|</span>1室1厅1卫
<span class="splitline">|</span><span title="建筑面积">46m²</span>
<span class="splitline">|</span> (高层)/共18层
<span class="splitline">|</span>南北
<span class="splitline">|</span> 豪华装修
</li>
曾经蜡笔没有小新2017-05-18 10:54:42
其實還是很簡單的,你看這個還是有規律的,規律在於有分隔符號|,我寫了個DEMO
something = '''<li><span class="info-tit">房屋概况:</span>住宅 <span class="splitline">|</span>1室1厅1卫<span class="splitline">|</span><span title="建筑面积">46m²</span><span class="splitline">|</span> (高层)/共18层
<span class="splitline">|</span>南北
<span class="splitline">|</span> 豪华装修
</li>''';
soup = BeautifulSoup(something, 'lxml')
plaintext = soup.select('li')[0].get_text().strip()
透過get_text()得到內在所有內容,然後移除空格。後面你就用split分割吧,後面的不寫了。
如果有問題再交流。