로 확장하면 적절한 HTML 태그가 아닌 요소가 문자열로 추가 될 수 있습니다.
메소드를 사용하십시오. 반대로, 메소드는 콘텐츠를 보존하는 동안 태그를 제거합니다. 대담하고 이탤릭체 태그를 제거하는 예를 들어 설명해 봅시다.
extend()
extend()
여기,
import requests from bs4 import BeautifulSoup req = requests.get('https://en.wikipedia.org/wiki/Python_(programming_language)') soup = BeautifulSoup(req.text, "lxml") new_soup = BeautifulSoup("<ol></ol>", "lxml") new_soup.ol.extend(['
메소드는이 문자열을 단일 문자열로 연결하여 출력을 단순화합니다.
결론 wrap()
unwrap()
이 튜토리얼은 아름다운 수프로 웹을 긁는 기반을 제공합니다. 웹 페이지를 구문 분석하고, 데이터를 추출하고, HTML 구조를 수정하고, 결과를 로컬로 저장하는 방법을 배웠습니다. 이를 통해 다양한 응용 프로그램의 웹 컨텐츠를 효과적으로 처리하고 조작 할 수 있습니다.
위 내용은 아름다운 수프로 파이썬에서 웹 페이지를 긁어 내기 : 검색 및 DOM 수정의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!