如何利用php数组对百万数据进行排重
在平时的工作中,经常接到要对网站的会员进行站内信、手机短信、email进行群发信息的通知,用户列表一般由别的同事提供,当中难免会有重复,为了避免重复发送,所以我在进行发送信息前要对他们提供的用户列表进行排重,下面我以uid列表来讲讲我是如何利用php数组进行排重的。
假如得到一个uid列表,数量在百万行以上,格式如下:
10001000
10001001
10001002
................
10001000
................
10001111
其实利用php数组的特性,很好进行排重,我们先来看一下php数组的定义:PHP 中的数组实际上是一个有序映射。映射是一种把 values 关联到 keys 的类型。此类型在很多方面做了优化,因此可以把它当成真正的数组,或列表(向量),散列表(是映射的一种实现),字典,集合,栈,队列以及更多可能性。数组元素的值也可以是另一个数组。树形结构和多维数组也是允许的。
在php的数组中,键(keys)也称为索引,具有唯一性,我们正可以利用这一特性进行排重,示例代码如下:
<?php //定义一个数组,用于存放排重后的结果 $result = array(); //读取uid列表文件 $fp = fopen('test.txt', 'r'); while(!feof($fp)) { $uid = fgets($fp); $uid = trim($uid); $uid = trim($uid, "r"); $uid = trim($uid, "n"); if($uid == '') { continue; } //以uid为key去看该值是否存在 if(empty($result[$uid])) { $result[$uid] = 1; } } fclose($fp); //将结果保存到文件 $content = ''; foreach($result as $k => $v) { $content .= $k."n"; } $fp = fopen('result.txt', 'w'); fwrite($fp, $content); fclose($fp); ?> |
还有,这可方法还可以用于两个文件进行排重的工作,如果你有两个uid列表文件,格式和上面的uid列表一样,示例程序如下:
<p><table cellspacing="0" cellpadding="6" width="95%" align="center" border="0" style="border-right: #0099cc 1px solid; table-layout: fixed; border-top: #0099cc 1px solid; border-left: #0099cc 1px solid; border-bottom: #0099cc 1px solid"><tbody><tr><td bgcolor="#ddedfb" style="word-wrap: break-word"><pre class="code"> <?php //定义数组,用于存放排重后的结果 $result = array(); //读取第一个uid列表文件,放入$result_1 $fp = fopen('test_1.txt', 'r'); while(!feof($fp)) { $uid = fgets($fp); $uid = trim($uid); $uid = trim($uid, "r"); $uid = trim($uid, "n"); if($uid == '') { continue; } //以uid为key写入$result,如有重复就会覆盖 $result[$uid] = 1; } fclose($fp); //读取第二个uid列表文件,并进行排重操作 $fp = fopen('test_2.txt', 'r'); while(!feof($fp)) { $uid = fgets($fp); $uid = trim($uid); $uid = trim($uid, "r"); $uid = trim($uid, "n"); if($uid == '') { continue; } //以uid为key去看该值是否存在 if(empty($result[$uid])) { $result[$uid] = 1; } } fclose($fp); //$result里保存的就排重以后的结果,可以输出到文件,代码省略 ?>
仔细想想,不难发现,利用数组的这一特性还可以解决我们工作中的更多问题。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3 Linux新版
SublimeText3 Linux最新版

记事本++7.3.1
好用且免费的代码编辑器

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中