python - Beautiful Soup当标签同级时候要怎么取值？

Question

遇到一个平级标签的页面，如下显示： {代码...} 我最终要取得的值是 测试标题一 {代码...} ... 测试标题四 {代码...} 我原本使用的是 {代码...} 这样是可以把需要的h2取到，但想要在继续循环去那些小标题时候，由...

PHP中文网 · Answer

h2_a = soup.find_all('h2')
for i_a in h2_a:
    if i_a.a:
        print (i_a.text,'，',i_a.a['href'])
    else:
        print (i_a.text)

Di bawah python3. Saya tidak tahu cara menulis cetakan python2 Saya tertanya-tanya jika ia memenuhi keperluan anda

PHP中文网 · Answer

Saya tidak boleh mengeja bahasa Cina untuk OS yang buruk.

Saya rasa kita boleh menyelesaikan soalan ini menggunakan re.

import re
resList = b = re.findall(r'(.*?)
([\w\W]*?)(?=(()|()))',html.replace('
',''))

kemudian: anggap a dalam resList, a[0] ialah tajuk induk dan a[1] ialah sub kandungan.
cubalah.

阿神 · Answer

soup.find_all('h2', class_=None)
Dengan cara ini anda boleh mencari terus apa yang anda perlukan.