百度关键词搜索页面DOM结构特点
分析了一天的百度搜索Dom结构,有点小规律,搜索出的内容,如果是广告的话都会放在一个大的div中,非广告的话,每个内容独自一个盒子,盒子的class名可以有多个,但必有c-container,这个属性可以判断这条内容是否为广告,然后是每个非广告的盒子里都有一个id,这个id是在这个关键词下该网站的百度排名,要取出该网站的网址,可以通过获取class名为c-showurl的标签中的html值
博客列表 >百度关键词搜索页面DOM结构特点
百度关键词搜索页面DOM结构特点
分析了一天的百度搜索Dom结构,有点小规律,搜索出的内容,如果是广告的话都会放在一个大的div中,非广告的话,每个内容独自一个盒子,盒子的class名可以有多个,但必有c-container,这个属性可以判断这条内容是否为广告,然后是每个非广告的盒子里都有一个id,这个id是在这个关键词下该网站的百度排名,要取出该网站的网址,可以通过获取class名为c-showurl的标签中的html值