巴扎黑2017-04-17 17:35:35
不知道你說的爬蟲是指百度爬蟲還是我們自己寫的爬蟲。
百度爬蟲按樓上的方法就好了,而防止別人的爬蟲有很多方法,比如所有class,或者id都動態生成。因為爬蟲解析html一般是透過class或id來取得想要的東西的。
迷茫2017-04-17 17:35:35
1) JS什麼的可以試試gzip壓縮,很多爬蟲不會爬取gzip壓縮的js
2)使用log分析web伺服器的日誌,如果是惡意的訪問你的關鍵資源的,而對方是固定IP,可以試著ban掉對方IP
天蓬老师2017-04-17 17:35:35
沒有用的,首先你的網站本身對人公開,那自然也就對爬蟲公開,除非換成內部網絡,如果你把精力做到防止爬蟲上去,還不如提高質量,現在分類信息網站都是爬來爬去,而使用者體驗基本上沒有提升。
巴扎黑2017-04-17 17:35:35
首先是你很難做到說100%不讓爬蟲爬取到,除非像樓上說的那樣是內部網絡。
但是你可以做一些的措施用來防止一些技術含量低的小爬蟲爬取你的網站。
具體的措施可以移步到知乎,看看這篇文章點這裡
希望能幫到你