집 >백엔드 개발 >파이썬 튜토리얼 >URL을 추출할 때 `re.findall()`에서 `TypeError: Can\'t Use a String Pattern on a Bytes-Like Object`가 발생하는 이유는 무엇입니까?

URL을 추출할 때 `re.findall()`에서 `TypeError: Can\'t Use a String Pattern on a Bytes-Like Object`가 발생하는 이유는 무엇입니까?

Susan Sarandon원래의: 2024-11-17 11:31:02724검색

Why Does `re.findall()` Throw a `TypeError: Can't Use a String Pattern on a Bytes-Like Object` When Extracting URLs?

TypeError: re.findall()의 바이트 유사 객체에 문자열 패턴을 사용할 수 없습니다.

자동으로 가져오는 동안 웹페이지의 URL에서 다음 오류가 발생할 수 있습니다.

TypeError: can't use a string pattern on a bytes-like object in re.findall()

코드에서 re.findall()을 사용하여 정규식 정규식과 일치하는 항목을 찾습니다. 그러나 가져온 HTML 콘텐츠에 정규식을 적용하려고 하면 오류가 발생합니다.

기본 원인:

이 문제는 작업 중인 HTML 콘텐츠는 바이트 형식인 반면, 사용 중인 정규식은 문자열 형식이라는 사실입니다. 정규 표현식은 바이트형 객체에 직접 적용할 수 없습니다.

Lösung:

이 문제를 해결하려면 HTML 콘텐츠를 문자열로 변환해야 합니다.

html = response.read().decode('utf-8')

이렇게 하면 바이트 형식의 HTML 콘텐츠가 문자열로 디코딩되어 정규 표현식이 성공적으로 적용될 수 있습니다.

변환이 완료되면 다음을 사용할 수 있습니다. 웹페이지 제목을 찾는 정규식입니다. 수정된 코드는 다음과 같습니다.

import urllib.request
import re

url = "http://www.google.com"
regex = r'<title>(,+?)</title>'
pattern = re.compile(regex)

with urllib.request.urlopen(url) as response:
   html = response.read().decode('utf-8')

title = re.findall(pattern, html)
print(title)

위 내용은 URL을 추출할 때 `re.findall()`에서 `TypeError: Can\'t Use a String Pattern on a Bytes-Like Object`가 발생하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

html String Object for while try throw Error using Regex this issue

성명：

이전 기사：페이지 로드 대기 시간을 제한하여 Selenium 스크립트를 더 빠르게 만드는 방법은 무엇입니까?다음 기사：페이지 로드 대기 시간을 제한하여 Selenium 스크립트를 더 빠르게 만드는 방법은 무엇입니까?