찾다
백엔드 개발파이썬 튜토리얼Python에서 Beautiful Soup을 사용하여 속성 값 추출

使用Python中的Beautiful Soup提取属性值

뷰티플수프로 속성값을 추출하려면 HTML 문서를 파싱한 후 필요한 속성값을 추출해야 합니다. BeautifulSoup은 HTML 및 XML 문서를 구문 분석하기 위한 Python 라이브러리입니다. BeautifulSoup은 문서에서 데이터를 쉽게 추출하기 위해 구문 분석 트리를 검색하고 탐색하는 다양한 방법을 제공합니다. 이번 글에서는 Beautiful Soup in Python의 도움으로 속성값을 추출해보겠습니다.

알고리즘

아래 알고리즘에 따라 Python에서 아름다운 수프를 사용하여 속성 값을 추출할 수 있습니다.

  • bs4 라이브러리의 BeautifulSoup 클래스를 사용하여 HTML 문서를 구문 분석하세요.

  • 추출하려는 속성이 포함된 HTML 요소를 찾으려면 적절한 BeautifulSoup 메서드(예: find() 또는 find_all())를 사용하세요.

  • 조건문이나 has_attr() 메서드를 사용하여 해당 속성이 요소에 존재하는지 확인하세요.

  • 속성이 존재하는 경우 대괄호([])와 속성 이름을 키로 사용하여 해당 값을 추출합니다.

  • 속성이 존재하지 않는 경우 오류를 적절하게 처리하시기 바랍니다.

아름다운 수프 설치

BeautifulSoup 라이브러리를 사용하기 전에 Python 패키지 관리자인 pip 명령을 사용하여 설치해야 합니다. Beautiful Soup을 설치하려면 터미널이나 명령 프롬프트에 다음 명령을 입력하세요.

으아악

속성 값 추출

HTML 태그에서 속성 값을 추출하려면 먼저 BeautifulSoup을 사용하여 HTML 문서를 구문 분석해야 합니다. 그런 다음 Beautiful Soup 메소드를 사용하여 HTML 문서에 있는 특정 태그의 속성값을 추출합니다.

예제 1: find() 메소드와 대괄호를 사용하여 href 속성 추출

아래 예에서는 먼저 HTML 문서를 생성하고 이를 파서 유형 html.parser를 사용하여 Beautiful Soup 생성자에 문자열로 전달합니다. 다음으로, 수프 객체의 find() 메소드를 사용하여 "a" 태그를 찾습니다. 그러면 HTML 문서에서 처음으로 나타나는 "a" 태그가 반환됩니다. 마지막으로 대괄호 표기법을 사용하여 "a" 태그에서 href 속성 값을 추출합니다. 그러면 href 속성의 값이 문자열로 반환됩니다.

으아악

출력

으아악

예 2: attr을 사용하여 특정 속성을 가진 요소 찾기

아래 예에서는 find_all() 메소드를 사용하여 href 속성이 있는 모든 `a` 태그를 찾습니다. 'attrs' 매개변수는 우리가 찾고 있는 속성을 지정하는 데 사용됩니다. `{'href': True}`는 모든 값의 href 속성을 가진 요소를 찾도록 지정합니다.

으아악

출력

으아악

예 3: find_all() 메서드를 사용하여 요소의 모든 항목을 찾습니다.

때때로 웹페이지에서 HTML 요소의 모든 항목을 찾고 싶을 수도 있습니다. 이를 달성하려면 find_all() 메서드를 사용할 수 있습니다. 아래 예에서는 find_all() 메서드를 사용하여 컨테이너 클래스가 있는 모든 div 태그를 찾습니다. 그런 다음 각 div 태그를 반복하여 그 안에 있는 h1 및 p 태그를 찾습니다.

으아악

출력

으아악

예 4: select()를 사용하여 CSS 선택기를 통해 요소 찾기

아래 예에서는 select() 메서드를 사용하여 클래스 컨테이너가 있는 div 태그 내의 모든 h1 태그를 찾습니다. 이를 달성하기 위해 CSS 선택기 'div.container h1'가 사용됩니다. . 는 클래스 이름을 나타내는 데 사용되고 공백은 하위 선택자를 나타내는 데 사용됩니다.

으아악

출력

으아악

결론

이 기사에서는 Python의 Beautiful Soup 라이브러리를 사용하여 HTML 문서에서 속성 값을 추출하는 방법에 대해 논의했습니다. BeautifulSoup에서 제공하는 방법을 사용하면 HTML 및 XML 문서에서 필요한 데이터를 쉽게 추출할 수 있습니다.

위 내용은 Python에서 Beautiful Soup을 사용하여 속성 값 추출의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 tutorialspoint에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
파이썬 : 편집과 해석에 대한 깊은 다이빙파이썬 : 편집과 해석에 대한 깊은 다이빙May 12, 2025 am 12:14 AM

Pythonusesahybridmodelofilationandlostretation : 1) ThePyThoninterPretreCeterCompileSsourcodeIntOplatform-IndependentBecode.

Python은 해석 된 또는 편집 된 언어입니까? 왜 중요한가?Python은 해석 된 또는 편집 된 언어입니까? 왜 중요한가?May 12, 2025 am 12:09 AM

Pythonisbothingretedandcompiled.1) 1) it 'scompiledtobytecodeforportabilityacrossplatforms.2) thebytecodeisthentenningreted, withfordiNamictyTeNgreted, WhithItmayBowerShiledlanguges.

루프 대 파이썬의 루프 : 주요 차이점 설명루프 대 파이썬의 루프 : 주요 차이점 설명May 12, 2025 am 12:08 AM

forloopsareideal when

루프를위한 것 및 기간 : 실용 가이드루프를위한 것 및 기간 : 실용 가이드May 12, 2025 am 12:07 AM

forloopsareusedwhendumberofitessiskNowninadvance, whilewhiloopsareusedwhentheationsdepernationsorarrays.2) whiloopsureatableforscenarioScontiLaspecOndCond

파이썬 : 진정으로 해석 되었습니까? 신화를 파악합니다파이썬 : 진정으로 해석 되었습니까? 신화를 파악합니다May 12, 2025 am 12:05 AM

pythonisnotpurelynlogreted; itusesahybrideprophorfbyodecodecompilationandruntime -INGRETATION.1) pythoncompilessourcecodeintobytecode, thepythonVirtualMachine (pvm)

동일한 요소를 가진 Python Concatenate 목록동일한 요소를 가진 Python Concatenate 목록May 11, 2025 am 12:08 AM

ToconcatenatelistsinpythonwithesameElements, 사용 : 1) OperatorTokeEpduplicates, 2) asettoremovedUplicates, or3) listComperensionForControlOverDuplicates, 각 methodHasDifferentPerferformanCeanDorderImpestications.

해석 대 컴파일 언어 : Python 's Place해석 대 컴파일 언어 : Python 's PlaceMay 11, 2025 am 12:07 AM

PythonisancerpretedLanguage, 비판적 요소를 제시하는 PytherfaceLockelimitationsIncriticalApplications.1) 해석 된 언어와 같은 thePeedBackandbackandrapidProtoTyping.2) CompilledlanguagesLikec/C transformt 해석

루프를 위해 및 while 루프 : 파이썬에서 언제 각각을 사용합니까?루프를 위해 및 while 루프 : 파이썬에서 언제 각각을 사용합니까?May 11, 2025 am 12:05 AM

useforloopswhhenmerfiterationsiskNownInAdvance 및 WhileLoopSweHeniTesslationsDepoyConditionismet whilEroopsSuitsCenarioswhereTheLoopScenarioswhereTheLoopScenarioswhereTheLoopScenarioswhereTherInatismet, 유용한 광고 인 푸트 gorit

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구

맨티스BT

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

SublimeText3 영어 버전

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!