group-by - mysql group by 优化的问题

Question

我有一张接近八千万条数据的彩虹表，然后里面有二十多万条的重复数据，我想使用GROUP BY 进行分组，但是使用了GROUP BY语句以后，mysql会生出一张零时表，而零时表，把我的硬盘全部沾满了，所以，求个办法，能帮...

迷茫 · Answer

不赞成用一条SQL语句来搞定这类问题，因为数据库耗不起。可以用程序来实现(比如写个Python脚本)，步骤是这样的：