>  기사  >  웹 프론트엔드  >  HTML 단락 간격에 공백 두 개 추가

HTML 단락 간격에 공백 두 개 추가

PHPz
PHPz원래의
2024-04-09 14:09:02383검색

이 코드는 웹 데이터를 스크랩 및 구문 분석하고 데이터베이스로 가져오는 데 필요한 라이브러리를 가져오는 데 사용할 수 있습니다. Python 요청 라이브러리를 사용하여 웹 페이지를 가져옵니다. BeautifulSoup 라이브러리를 사용하여 페이지를 구문 분석하고 필요한 데이터를 추출합니다. 데이터베이스 연결을 설정하고 SQLite3 라이브러리를 사용하여 테이블을 생성했습니다. 추출된 데이터를 데이터베이스 테이블에 씁니다. 변경 사항을 커밋하고 데이터베이스 연결을 닫습니다.

HTML 段落间距加两格

Python 및 SQL을 사용하여 웹 데이터 스크랩 및 구문 분석

필수 라이브러리 가져오기

import requests
from bs4 import BeautifulSoup
import sqlite3

웹 페이지 요청 및 구문 분석

url = 'https://example.com/page/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

필요한 데이터 추출

find_all()get_text() 메서드를 사용하여 페이지.

titles = soup.find_all('h1')
titles = [title.get_text() for title in titles]

데이터베이스 연결 설정

conn = sqlite3.connect('database.db')
c = conn.cursor()

데이터베이스에 데이터 쓰기

for title in titles:
    c.execute('INSERT INTO titles (title) VALUES (?)', (title,))

변경 사항 커밋 및 연결 닫기

conn.commit()
conn.close()

실제 사례

이 코드를 사용하여 Amazon 홈페이지의 상위 제품 제목 데이터를 스크랩하여 SQLite에 저장합니다. 데이터베이스 중간. 데모 코드는 다음과 같습니다:

import requests
from bs4 import BeautifulSoup
import sqlite3

url = 'https://amazon.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

titles = soup.find_all('h2', {'class': 'a-size-medium s-inline s-access-title'})
titles = [title.get_text().strip() for title in titles]

conn = sqlite3.connect('amazon_titles.db')
c = conn.cursor()
for title in titles:
    c.execute('INSERT INTO titles (title) VALUES (?)', (title,))

conn.commit()
conn.close()

위 내용은 HTML 단락 간격에 공백 두 개 추가의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.