如何從 MySQL 資料庫有效地擷取簡單隨機樣本
在 SQL 中,從大型資料集中取得隨機樣本可能具有挑戰性。傳統方法涉及按隨機值對行進行排序並選擇所需的行數。然而,這種方法效率低下,因為它需要昂貴的排序和 RAND() 評估。
特別對於 MySQL,另一種方法可顯著提高效能。透過利用 MySQL 的 RAND() 函數來產生均勻分佈的隨機數的獨特功能,我們可以完全避免排序。
公式如下:
select * from table where rand() <= ( desired sample size / total rows )
此查詢產生一個每行的隨機數,值範圍為0到1。透過將這個隨機數與基於所需樣本大小和總行數的閾值進行比較,我們可以確定是否顯示row.
這種方法可以實現高效的O(n) 性能,而無需排序的開銷。資料庫可以快速選擇所需的樣本大小,而不會產生每行 RAND() 計算的大量計算時間或排序的複雜性。
透過利用 MySQL 的 rand() 函數的強大功能,我們獲得了以下能力以最佳速度和效率檢索簡單的隨機樣本。
以上是如何有效率地從MySQL資料庫中取得簡單的隨機樣本?的詳細內容。更多資訊請關注PHP中文網其他相關文章!