首頁  >  文章  >  後端開發  >  詳解php如何對百萬級資料進行快速排重

詳解php如何對百萬級資料進行快速排重

*文
*文原創
2018-01-05 18:03:292593瀏覽

在平常的工作中,經常接到要對網站的會員進行站內信、手機短信、email進行群發信息的通知,用戶列表一般由別的同事提供,當中難免會有重複,為了避免重複發送,所以我在進行發送訊息前要對他們提供的用戶列表進行排重,下面我以uid列表來講講我是如何利用php數組進行排重的。希望對大家有幫助。

假如得到一個uid列表,數量在百萬行以上,格式如下: 

10001000 
10001001 
10001002 
...... 
10001000 
...... 
10001111  

其實利用php數組的特性,很好進行排重,我們先來看一下php數組的定義:PHP 中的陣列其實是一個有序映射。映射是一種把 values 關聯到 keys 的型別。此類型在很多方面做了優化,因此可以把它當成真正的數組,或列表(向量),散列表(是映射的一種實現),字典,集合,棧,隊列以及更多可能性。數組元素的值也可以是另一個數組。樹狀結構和多維數組也是允許的。
在php的陣列中,鍵(keys)也稱為索引,具有唯一性,我們正可以利用這一特性進行排重,範例程式碼如下: 

<?php
//定义一个数组,用于存放排重后的结果 
$result = array(); 
//读取uid列表文件 
$fp = fopen(&#39;test.txt&#39;, &#39;r&#39;); 
while(!feof($fp)) 
{ 
$uid = fgets($fp); 
$uid = trim($uid); 
$uid = trim($uid, "\r"); 
$uid = trim($uid, "\n"); 
if($uid == &#39;&#39;) 
{ 
continue; 
} 
//以uid为key去看该值是否存在 
if(empty($result[$uid])) 
{ 
$result[$uid] = 1; 
} 
} 
fclose($fp); 
//将结果保存到文件 
$content = &#39;&#39;; 
foreach($result as $k => $v) 
{ 
$content .= $k."\n"; 
} 
$fp = fopen(&#39;result.txt&#39;, &#39;w&#39;); 
fwrite($fp, $content); 
fclose($fp); 
?>  

20多行程式碼,就可以對百萬以上的數據進行排重,效率也不錯,非常實用。手機號碼、email,也可以採用這種方式來排重。
還有,這可方法還可以用於兩個文件進行排重的工作,如果你有兩個uid列表文件,格式和上面的uid列表一樣,示例程序如下: 

<?php 
//定义数组,用于存放排重后的结果 
$result = array(); 
//读取第一个uid列表文件,放入$result_1 
$fp = fopen(&#39;test_1.txt&#39;, &#39;r&#39;); 
while(!feof($fp)) 
{ 
$uid = fgets($fp); 
$uid = trim($uid); 
$uid = trim($uid, "\r"); 
$uid = trim($uid, "\n"); 
if($uid == &#39;&#39;) 
{ 
continue; 
} 
//以uid为key写入$result,如有重复就会覆盖 
$result[$uid] = 1; 
} 
fclose($fp); 
//读取第二个uid列表文件,并进行排重操作 
$fp = fopen(&#39;test_2.txt&#39;, &#39;r&#39;); 
while(!feof($fp)) 
{ 
$uid = fgets($fp); 
$uid = trim($uid); 
$uid = trim($uid, "\r"); 
$uid = trim($uid, "\n"); 
if($uid == &#39;&#39;) 
{ 
continue; 
} 
//以uid为key去看该值是否存在 
if(empty($result[$uid])) 
{ 
$result[$uid] = 1; 
} 
} 
fclose($fp); 
//$result里保存的就排重以后的结果,可以输出到文件,代码省略 
?>


仔細想想,不難發現,利用陣列的這項特性還可以解決我們工作中的更多問題。

以上是詳解php如何對百萬級資料進行快速排重的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn