Python은 데이터를 크롤링하고 목록을 가져옵니다. 그런데 그 안에 있는 span 태그를 제거하는 방법은 무엇입니까?

Question

p6ython3.6을 사용하여 일부 데이터를 크롤링했지만 최종적으로 표시되는 것은 범위 태그가 포함된 목록이었습니다. get_text, 내용 등을 사용하면 오류가 보고되었습니다. 왜 이런거야?
반환된 초기 결과는 다음과 같습니다.

으아악

제 코드는 다음과 같습니다:

으아악

仅有的幸福 · Answer

bs의 API는 잘 기억나지 않습니다. 텍스트를 직접 얻을 수 있는 함수가 있어야 합니다. get_text() 함수여야 합니다. find_all()을 사용하고 있으므로 반환된 결과를 다시 순회해야 합니다. 그게 전부입니다get_text()这个函数吧。由于你用的是find_all(),那么需要再在返回的结果下做一次遍历，就是这样

rs = list()
for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
    contents=data.find("i",{"class":"cell date"}).find_all("span")
    for content in contents:
        rs.append(content.get_text())

此外，也可以使用正则表达式来匹配，直接匹配(.*?)< 으아아아 또한 정규 표현식을 사용하여 (.*?)< 패턴과 직접 일치시킬 수도 있습니다. 하지만 위와 같이 콘텐츠 목록을 순회해야 합니다.

phpcn_u1582 · Answer

질문자는 text_content()방법

을 시도해 볼 수 있습니다.

ringa_lee · Answer

정규식이나 분할+SUBSTRING도 사용할 수 있으니 유연하게 사용하세요

Python은 데이터를 크롤링하고 목록을 가져옵니다. 그런데 그 안에 있는 span 태그를 제거하는 방법은 무엇입니까?

모든 응답(3)나는 대답할 것이다