有效率地從MySQL 資料庫查詢隨機樣本
初始方法與限制:
使用SELECT * FROM table ORDER BY 產生隨機樣本的簡單方法RAND() LIMIT 10000 面臨大表的效能瓶頸。由於需要對整個表進行排序,這種方法計算量很大,對於具有數十萬行的表來說不切實際。最佳化取樣技術:
An有效的替代方法是利用以下查詢:SELECT * FROM table WHERE rand() <= .3此查詢採用下列原則:
條件選擇: 然後評估每一行,根據隨機數是否小於或等於來確定是否應將其包含在樣本中0.3.
以上是如何有效率地從大型MySQL資料庫中查詢隨機樣本?的詳細內容。更多資訊請關注PHP中文網其他相關文章!