BeautifulSoup nimmt alle Daten auf, aber .findAll() gibt nur Links zu einem übergeordneten Element zurück

Question

Ich versuche, eine Website mit BeautifulSoup in Python zu crawlen. Alle Daten werden erfasst, einschließlich aller Links, auf die ich zuzugreifen versuche. Wenn ich jedoch die Funktion .findAll() verwende, gibt sie nur einen Teil des gesuchten Links zurück. Das heißt, es wird nur der Link /html/body/div[1]/div/div[2]/div/div[2]/div[1] im folgenden xpath zurückgegeben. Dadurch wird der Link /html ignoriert /body/div in [1]/div/div[2]/div/di

P粉553428780 · Answer

您在页面上看到的数据以 Json 形式存储在

BeautifulSoup nimmt alle Daten auf, aber .findAll() gibt nur Links zu einem übergeordneten Element zurück

Antworte allen(1)Ich werde antworten