프론트엔드에서는 어떻게 수집을 최대한 방지할 수 있나요? 좋은 구현 솔루션은 무엇입니까?
프론트엔드에서는 어떻게 수집을 최대한 방지할 수 있나요? 좋은 구현 솔루션은 무엇입니까?
가서 크롤링사이트나 안티크롤러 내용을 배워보고 하나씩 대책을 세워보아요, 하하
보통 체크해두는데referer
소용없어요...
아무도 연구해 본 적이 없나요?
크롤러가 크롤링하는 것을 방지하시겠습니까? 완벽한 해결책은 없는 것 같습니다
완벽한 방법은 없습니다. 단시간에 100회 방문 등 IP 요청 횟수를 기준으로 IP를 차단하는 보조적인 방법도 있습니다. . 하지만 에이전트가 있기 때문에 쓸모가 없으며 초보자에 대해서만 보호할 수 있습니다.
한 쪽 끝에 10개의 동시 실행만 허용하는 등 동시성 제한이 있을 수 있습니다.
사실 IP프록시+멀티스레딩은 아직까지 동시성 한계를 뛰어넘고 있어서 초보자에게만 해당됩니다.
ajax는 데이터를 가져와 표시합니다. 일반 컬렉션은 js 실행을 지원하지 않습니다.
깨진 기호를 추가하되, 깨진 문자가 표시되지 않도록 하려면 div 및 기타 태그를 사용하세요(예: 보이지 않음, 가장 작은 글꼴 크기, 배경색과 동일한 색상). 이 방법은 이전에 "Reader" 공식 웹사이트에서 사용된 적이 있습니다.
프런트 엔드에서 수집 방지 효과를 달성하는 사람은 누구나 노벨 물리학상을 받을 수 있습니다. -- By phantomjs
URL을 포함한 숨겨진 컨트롤을 추가하세요. 이 URL에 액세스하는 사람은 바로 기계입니다