PHP中文网2017-04-17 15:33:19
假設你的表名是user:
select * from user where name in (select name from user group by name having count(1) > 1);
迷茫2017-04-17 15:33:19
select * from user group by (...) having count(*) > 1
就夠了,不需要再用in。
其實高效什麼的你真的想太多了,這屬於設計失誤,花時間修復一次然後修改表結構防止此類問題再次發生才是正根。
另外這個表沒有id,所以你也不能自動刪除重複的數據,因為寫不出條件,只能再用中間表去倒。
綜上,別考慮效率了,手工改正就好。
阿神2017-04-17 15:33:19
SELECT * FROM user AS a
WHERE EXISTS (
SELECT 1 FROM user AS b
WHERE a.name = b.name
GROUP BY name
HAVING COUNT(1) > 1
)
由於涉及全表GROUP BY
,所以效能比較低。
如果可以修改表格結構的話,建議增加一個欄位表示該使用者名稱是否重名,該欄位在寫入資料的時候就可以判斷維護了。
PHP中文网2017-04-17 15:33:19
資料庫的世界沒有魔法,索引之所以能加快搜尋速度就是因為它預先處理了,用延長每次插入更新資料的時間來加快搜尋速度,都是有代價的。
回到這個問題,你可以在name上加索引,這樣group by就能更有效率一點,但是根據你的需求還是要子查詢。
不過在name上加索引我覺得不是個健康的做法。如果是我,解決這個問題會做一個計時任務:掃描重名的用戶,把ID記錄在某個表A上。然後頁面上顯示時直接把表A拿出來關聯使用者表即可。之所以這樣做還有一個原因就是這個工作並非要做到很嚴格,而且實際上有點誤差是無妨的。