自主开发的百度云盘搜索引擎。
之前我也做过百度云盘搜索功能,使用的是搜索引擎的的站内搜索功能site:pan.baidu.com,看了现在绝大大多数的网盘搜索都是使用的这个技巧。这次升级的版本是自己独立开发的网盘爬虫,2天爬取了60W搜索(实际上还可以能多,因为瞬时爬取频率太高,百度会封IP,考虑分布式的爬虫或代理IP能很好解决这个问题)。
使用到的技术:前台:PHP(thinkphp框架),后台爬虫:Python,前端界面bootstrap框架
程序部分截图
首页
结果页
后台爬虫管理,还在开发中。。。
爬虫做好了,搜索功能还没做好,只能精确搜索,所以大家注意下关键词。
演示网址:http://pan.whatsoo.com
AD:真正免费,域名+虚机+企业邮箱=0元