Heim  >  Fragen und Antworten  >  Hauptteil

python - beautifulSoup4 .select('.bnrName') kann den Texttext nicht abrufen

Hintergrund:
Verwenden Sie die Auswahl von bs4 unter Python3, um den Shopnamen in den Coupon-Informationen oben auf der ZOZO-Homepage abzurufen. (Inländische IP-Adresse scheint die Gutscheininformationen nicht sehen zu können. Sie müssen durchblättern, um sie anzuzeigen. Verwenden Sie am besten die IP-Adresse eines Inselstaats.)

Frage:
Ich kann nicht finden, wo der Name seines Shops steht. Ich weiß nicht, wie ich die Frontend-Js bekomme. Danke.

Mein Code lautet wie folgt:

import requests, bs4

shopName = 'BEAUTY&YOUTH'
url = 'http://zozo.jp/'

def getZozoCoupon():
    res = requests.get(url, headers={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.110 Safari/537.36"})
    res.raise_for_status()
    soup = bs4.BeautifulSoup(res.text, 'html.parser')
    elems = soup.select('.bnrName')
    return elems[0].text.strip()

Der Screenshot unten ist der Text, den Sie erhalten möchten,

Ich habe festgestellt, dass der Quellcode keinen Text enthält.

<p class="couponInfo">
    <p class="bnrName">说好的文字呢。。。</p>
    <p class="bnrText"></p>
</p>

Bitte sagen Sie mir, wo sein Text implementiert ist und wie ich ihn mit bs4 select anzeigen kann. Vielen Dank.

伊谢尔伦伊谢尔伦2711 Tage vor745

Antworte allen(4)Ich werde antworten

  • 大家讲道理

    大家讲道理2017-05-18 10:47:48

    有可能用ajax从服务器获取之后操作dom动态添加的吧,在浏览器里执行了js就文字也被添加进来。而你用爬虫爬的时候没有执行有关js所以也没有添加文字。

    要是真的这样的话,你可以在浏览器的f12那里查看network,把获取文字的那个http请求的url找出来,直接请求这个url获取你需要的信息。

    Antwort
    0
  • 習慣沉默

    習慣沉默2017-05-18 10:47:48

    我在浏览器中打开http://zozo.jp/查看源代码并没有找到你所要找的bnrName

    Antwort
    0
  • 高洛峰

    高洛峰2017-05-18 10:47:48

    你在浏览器上右键“查看网页源码”看看能不能找得你那段文字,如果找不到,那网页应该是用js或者ajax动态加载的,想要爬取这种动态页面,两种方法,要么是自己手动模拟请求,要么就用selenium去抓吧

    Antwort
    0
  • 高洛峰

    高洛峰2017-05-18 10:47:48

    确实是js生成的,已经采用headless浏览器模拟抓取了,谢谢大家!

    Antwort
    0
  • StornierenAntwort