python - Beautiful Soup当标签同级时候要怎么取值？

Question

遇到一个平级标签的页面，如下显示： {代码...} 我最终要取得的值是 测试标题一 {代码...} ... 测试标题四 {代码...} 我原本使用的是 {代码...} 这样是可以把需要的h2取到，但想要在继续循环去那些小标题时候，由...

PHP中文网 · Answer

h2_a = soup.find_all('h2')
for i_a in h2_a:
    if i_a.a:
        print (i_a.text,'，',i_a.a['href'])
    else:
        print (i_a.text)

Sous python3. Je ne sais pas comment écrire l'impression de python2. Je me demande si elle répond à vos exigences

.

PHP中文网 · Answer

Je ne peux pas épeler le chinois pour le mauvais système d'exploitation.

Je pense que nous pouvons résoudre cette question en utilisant re.

import re
resList = b = re.findall(r'(.*?)
([\w\W]*?)(?=(()|()))',html.replace('
',''))

alors : supposons que a dans resList, a[0] est le titre parent et a[1] est le sous-contenu.
essayez-le.

阿神 · Answer

soup.find_all('h2', class_=None)
De cette façon, vous pouvez trouver directement ce dont vous avez besoin.