찾다

 >  Q&A  >  본문

Python은 데이터를 크롤링하고 목록을 가져옵니다. 그런데 그 안에 있는 span 태그를 제거하는 방법은 무엇입니까?

p6ython3.6을 사용하여 일부 데이터를 크롤링했지만 최종적으로 표시되는 것은 범위 태그가 포함된 목록이었습니다. get_text, 내용 등을 사용하면 오류가 보고되었습니다. 왜 이런거야?
반환된 초기 결과는 다음과 같습니다.

으아악

제 코드는 다음과 같습니다:

으아악
我想大声告诉你我想大声告诉你2755일 전1003

모든 응답(3)나는 대답할 것이다

  • 仅有的幸福

    仅有的幸福2017-05-18 10:57:53

    bs의 API는 잘 기억나지 않습니다. 텍스트를 직접 얻을 수 있는 함수가 있어야 합니다. get_text() 함수여야 합니다. find_all()을 사용하고 있으므로 반환된 결과를 다시 순회해야 합니다. 그게 전부입니다get_text()这个函数吧。由于你用的是find_all(),那么需要再在返回的结果下做一次遍历,就是这样

    rs = list()
    for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
        contents=data.find("i",{"class":"cell date"}).find_all("span")
        for content in contents:
            rs.append(content.get_text())
      

    此外,也可以使用正则表达式来匹配,直接匹配<span>(.*?)< 으아아아 또한 정규 표현식을 사용하여 <span>(.*?)< 패턴과 직접 일치시킬 수도 있습니다. 하지만 위와 같이 콘텐츠 목록을 순회해야 합니다.

    회신하다
    0
  • phpcn_u1582

    phpcn_u15822017-05-18 10:57:53

    질문자는 text_content()방법

    을 시도해 볼 수 있습니다.

    회신하다
    0
  • ringa_lee

    ringa_lee2017-05-18 10:57:53

    정규식이나 분할+SUBSTRING도 사용할 수 있으니 유연하게 사용하세요

    회신하다
    0
  • 취소회신하다