SELECT SUBSTRING_INDEX(domain,".",-1) as tld, count(*) AS count \
FROM domain_whois WHERE flag <> -6 GROUP BY tld
domain_whois表中有两个字段,domain 与 flag。domain例:baidu.com, flag例:-6
大约七百万数据,运行上面的数据需要30+s时间,请问有什么技巧可以提高效率?
巴扎黑2017-04-17 13:29:26
用空间换时间,如果你经常进行这样的查询,增加一个字段tld,在入库的时候直接就运行好SUBSTRING_INDEX的结果,存入这个tld字段
不过由于你这个是全表扫描的,所以这样应该也还不够快,你可以进一步建立一张tld的冗余信息表,两个字段,一个是tld,一个是count数量,入库的时候更新数量,这样如果你要获取诸如com
, net
的tld的count(*)数据直接读取这个表即可
这是一个相对比较简单和初步优化的方案,记住性能和你怎么样去查询也是息息相关的