PHP를 사용하여 검색 엔진 봇 감지
웹 개발에서는 웹사이트에 대한 트래픽 소스를 식별해야 하는 경우가 종종 있습니다. 일반적인 작업 중 하나는 크롤러 또는 스파이더라고도 알려진 검색 엔진 봇을 탐지하는 것입니다.
솔루션
PHP를 사용하여 검색 엔진 봇을 탐지하려면 HTTP 사용자 에이전트를 분석하면 됩니다. 브라우저가 보낸 문자열입니다. 일반적으로 사용되는 접근 방식은 다음과 같습니다.
function _bot_detected() { return (isset($_SERVER['HTTP_USER_AGENT']) && preg_match('/bot|crawl|slurp|spider|mediapartners/i', $_SERVER['HTTP_USER_AGENT'])); }
이 코드는 HTTP 사용자 에이전트 문자열(예: "Googlebot")에 일반적으로 검색 엔진 봇과 관련된 특정 키워드가 포함되어 있는지 확인합니다. 봇이 감지되면 true를 반환하고 그렇지 않으면 false를 반환합니다.
최근 업데이트
Google bot의 사용자 에이전트 문자열이 최근 변경되었습니다. 2017년 6월 16일 현재 '미디어파트너스'라는 용어가 포함되어 있습니다. 이는 정확한 감지를 위해 위 코드에 사용된 정규식에 통합되었습니다.
위 내용은 PHP를 사용하여 검색 엔진 봇을 어떻게 감지할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!