Home  >  Article  >  Database  >  mysql随机查询若干条数据

mysql随机查询若干条数据

WBOY
WBOYOriginal
2016-06-07 15:18:161078browse

在 mysql 中查询 5 条不重复的数据,使用以下: SELECT * FROM ` table ` ORDER BY RAND () LIMIT 5 就可以了。但是真正测试一下才发现这样效率非常低。一个 15 万余条的库,查询 5 条数据,居然要 8 秒以上 搜索 Google ,网上基本上都是查询 max(id) * ran

mysql中查询5条不重复的数据,使用以下:

SELECT * FROM`table`ORDERBYRAND()LIMIT5

就可以了。但是真正测试一下才发现这样效率非常低。一个15万余条的库,查询5条数据,居然要8秒以上

搜索Google,网上基本上都是查询max(id) * rand()来随机获取数据。

SELECT *
FROM`table`ASt1JOIN(SELECTROUND(RAND() * (SELECTMAX(id)FROM`table`))ASid)ASt2
WHEREt1.id >= t2.id
ORDERBYt1.idASCLIMIT5;

但是这样会产生连续的5条记录。解决办法只能是每次查询一条,查询5次。即便如此也值得,因为15万条的表,查询只需要0.01秒不到。

上面的语句采用的是JOINmysql的论坛上有人使用

SELECT *
FROM`table`
WHEREid >= (SELECTFLOOR(MAX(id) * RAND())FROM`table`)
ORDERBYidLIMIT1;

我测试了一下,需要0.5秒,速度也不错,但是跟上面的语句还是有很大差距。总觉有什么地方不正常。

于是我把语句改写了一下。

SELECT * FROM`table`
WHEREid >= (SELECTfloor(RAND() * (SELECTMAX(id)FROM`table`))) 
ORDERBYidLIMIT1;

这下,效率又提高了,查询时间只有0.01

最后,再把语句完善一下,加上MIN(id)的判断。我在最开始测试的时候,就是因为没有加上MIN(id)的判断,结果有一半的时间总是查询到表中的前面几行。
完整查询语句是:

SELECT * FROM`table`
WHEREid >= (SELECTfloor(RAND() * ((SELECTMAX(id)FROM`table`)-(SELECTMIN(id)FROM`table`)) + (SELECTMIN(id)FROM`table`))) 
ORDERBYidLIMIT1;

SELECT *
FROM`table`ASt1JOIN(SELECTROUND(RAND() * ((SELECTMAX(id)FROM`table`)-(SELECTMIN(id)FROM`table`))+(SELECTMIN(id)FROM`table`))ASid)ASt2
WHEREt1.id >= t2.id
ORDERBYt1.idLIMIT1;

最后对这两个语句进行分别查询10次,
前者花费时间 0.147433
后者花费时间 0.015130
看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。 

 

 

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn