p6ython3.6을 사용하여 일부 데이터를 크롤링했지만 최종적으로 표시되는 것은 범위 태그가 포함된 목록이었습니다. get_text, 내용 등을 사용하면 오류가 보고되었습니다. 왜 이런거야?
반환된 초기 결과는 다음과 같습니다.
제 코드는 다음과 같습니다:
으아악仅有的幸福2017-05-18 10:57:53
bs의 API는 잘 기억나지 않습니다. 텍스트를 직접 얻을 수 있는 함수가 있어야 합니다. get_text()
함수여야 합니다. find_all()
을 사용하고 있으므로 반환된 결과를 다시 순회해야 합니다. 그게 전부입니다get_text()
这个函数吧。由于你用的是find_all()
,那么需要再在返回的结果下做一次遍历,就是这样
rs = list()
for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
contents=data.find("i",{"class":"cell date"}).find_all("span")
for content in contents:
rs.append(content.get_text())
此外,也可以使用正则表达式来匹配,直接匹配<span>(.*?)<
으아아아
또한 정규 표현식을 사용하여 <span>(.*?)<
패턴과 직접 일치시킬 수도 있습니다. 하지만 위와 같이 콘텐츠 목록을 순회해야 합니다.