>  기사  >  주제  >  거미 함정이란 무엇입니까?

거미 함정이란 무엇입니까?

青灯夜游
青灯夜游원래의
2019-05-24 14:11:356536검색

스파이더 트랩은 현장 검색, 전자상거래 제품, 플래시 웹사이트, 제한된 콘텐츠 등 스파이더 프로그램이 웹사이트를 크롤링하는 것을 막는 장애물을 말합니다. 스파이더 트랩의 가장 큰 특징은 스파이더가 특정 URL을 크롤링할 때 입구만 있고 출구는 없는 무한 루프에 들어간다는 점입니다.

거미 함정이란 무엇입니까?

SEO 업무에 있어 SEO 담당자는 매일 콘텐츠와 링크를 다루고 있으며, 현재의 관점에서 볼 때 미래 사이트의 장기적인 발전을 위해서는 독립적인 원본 콘텐츠의 중요성을 알고 있지만, 다, "거미 함정"을 피한다는 전제가 있습니다. 그렇다면 거미덫은 무엇일까요?

"거미덫"이란 무엇인가요?

"스파이더 트랩"은 스파이더 프로그램이 웹 사이트를 크롤링하는 것을 방지하는 장애물입니다. 일부 웹 사이트 디자인 기술은 검색 엔진에 매우 비우호적이며 스파이더 크롤링 및 크롤링에 도움이 되지 않습니다. 가장 큰 특징은 스파이더가 특정 URL을 크롤링할 때 입구만 있고 출구는 없는 무한 루프에 들어간다는 점입니다.

일반적인 "거미덫"이란 무엇입니까?

1. 사이트 내 검색

사이트에서 특정 키워드를 검색하려고 할 때 일반적이고 쉽게 발생하는 곳입니다. search.php?q=와 같은 URL 주소가 검색 엔진에 의해 크롤링되어 포함되면 의미 없는 검색 결과 페이지가 대량 생성될 가능성이 높습니다.

해결책: Robots.txt 파일을 통해 동적 매개변수를 차단할 수 있습니다.

2. 전자상거래 제품

과거에 전자상거래 웹사이트를 운영한 경험이 있다면 제품 SKU의 다양성 문제에 직면하게 될 것입니다. 동일한 테마 콘텐츠가 다른 SKU를 기반으로 여러 URL을 생성하게 됩니다. 이로 인해 페이지에 대량의 중복 콘텐츠가 발생하고 스파이더 크롤링 빈도가 심각하게 낭비됩니다.

물론 전자상거래 제품 페이지와 유사한 특별한 "스파이더 트랩"이 있는데, 이는 동적 콘텐츠 삽입으로 종종 거미를 부드러운 함정에 빠지게 만듭니다.

해결책: URL이 표준인지 확인하세요. rel=canonical 태그를 사용하여 비슷한 문제를 해결할 수 있습니다.

3. Flash 웹사이트

사용자의 시각적 경험을 만족시키기 위해 웹사이트 구축 회사에서는 일반적으로 Flash 웹사이트를 사용하여 사용자를 위한 기업 공식 웹사이트를 구축합니다. 그러나 현재 검색 엔진에서는 Flash 콘텐츠를 잘 크롤링하고 인식할 수 없습니다. 사이트 순위를 높이는 것이 어려운 경우가 많습니다.

해결책: 사이트 전체에 플래시를 사용하지 말고 웹페이지 콘텐츠의 일부에 플래시를 삽입해 보세요.

4. 제한된 콘텐츠

일부 사이트에서는 팬을 유치하기 위해 많은 콘텐츠를 로그인해야만 볼 수 있으며, 특히 쿠키를 강제로 유도하고 속이는 일부 작업은 쿠키를 식별하기 어렵게 만듭니다. 콘텐츠를 확인하고 이 URL을 지속적으로 크롤링해 보세요.

해결책: 웹사이트 구축 시 사용자를 유치하기 위해 이 전략을 사용하지 마세요.

"거미 함정"을 식별하는 방법

다음 내용만 확인하면 특히 쉽습니다.

① 웹사이트 로그: 도구를 사용하여 스파이더 크롤링된 URL의 내용을 읽습니다. 그날 특별한 URL 주소를 찾으면 더 많은 관심을 기울일 가치가 있습니다.

② 크롤링 빈도: 바이두 검색 리소스 플랫폼에서 크롤링 빈도를 확인하세요. 특정 날짜에 값이 특히 크면 스파이더 트랩에 빠질 가능성이 높습니다.

요약: 일반적으로 논의되는 스파이더 트랩에는 웹 사이트 프레임, 세션 ID 및 다양한 점프가 포함됩니다. 이 문서에서는 참고용으로 실제 응용 프로그램에서 일반적으로 발생하는 스파이더 트랩에 대해서만 간략하게 설명합니다.

위 내용은 거미 함정이란 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
이전 기사:소프트기사란?다음 기사:소프트기사란?