php排序1亿个QQ号码,该怎么处理-php教程-PHP中文网

首页

后端开发

php教程

php排序1亿个QQ号码,该怎么处理

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 am 11:59 AM

amparrforeachnbsp

php排序1亿个QQ号码
吃饱喝足了，还发贴了。
拆开分成几千份进行排序再合并。

首先先创建一个1亿个QQ号的txt。

<br /><?php<br /><br />// 创建一亿个QQ号的txt (大约需85~100秒)<br /><br />set_time_limit(0);<br />$fn = 'qq.txt';<br />$fp = fopen($fn, 'w');<br /><br />$st = microtime(true);<br /><br />$l = range(0,10000);<br />shuffle($l);<br />foreach ($l as $k=>$v)<br />{<br />	$arr = range($v*10000+10000,10000*($v+1)+9999);<br />	shuffle($arr);<br />	fputs($fp,implode("\n", $arr)."\n");<br />	unset($arr);<br />}<br /><br />echo  microtime(true)-$st;<br /><br />?><br />

稍等一两分钟1亿个随机QQ创建完成了。

QQ号码范围为>10000。文件大小大概有840MB。

下面就进行分类划分成几千份文件。

以QQ号码长度为文件夹，QQ号码前3位为文件名。

<br /><?php<br /><br />// 长度号码分类 (大约需360~400秒)<br /><br />set_time_limit(0);<br />$st = microtime(true);<br /><br />if(!is_dir('qq_no')) mkdir('qq_no');<br />$file = fopen('qq.txt', 'r'); <br /><br /><br />$i=0;<br />$end_s = '';<br />while(!feof($file))<br />{<br />	$g = 1042*1024;<br />	fseek($file,$g*$i);<br />	$s = fread($file, $g);<br /><br /> 	<br />	$end = strrpos($s, "\n");<br />	$arr_s = $end_s.substr($s, 0, $end);<br />	$end_s = substr($s, $end);<br /><br />	$arr = explode("\n", $arr_s);<br />	foreach ($arr as $k=>$v)<br />	{<br />		if($v!='')<br />		{<br />			$tag = "$v[0]$v[1]$v[2]";<br />			$text_arr[strlen($v)][$tag][] = $v;<br />		}<br />	}<br /><br />	foreach ($text_arr as $k=>$v)<br />	{<br />		$n_dir = 'qq_no/'.$k;<br />		if (!is_dir($n_dir)) mkdir($n_dir);<br />		foreach ($v as $tag=>$val)<br />		{<br />			$n_tf = fopen($n_dir.'/'.$tag.'.txt', 'a+');<br />			fputs($n_tf,implode("\n",$val)."\n");<br />		}<br />		<br />		<br />	}<br />	unset($text_arr);<br /><br />	++$i;<br /><br />}<br /><br />echo  microtime(true)-$st;<br /><br />?><br />

最后就要每个文件进行排序合并数据了。

<br /><?php<br /><br />// 排序完成拉 (800~920秒)<br /><br />set_time_limit(0);<br />$st = microtime(true);<br /><br />$qq_done = fopen('qq_done.txt', 'a+');<br /><br />$root = 'qq_no';<br />$dir_array = scandir($root);<br /><br />foreach ($dir_array as $key=>$val)<br />{<br />	if ($val != '.' && $val != '..')<br />		$dirs[$val] =  scandir($root.'/'.$val);<br />}<br /><br /><br />foreach ($dirs as $key=>$val)<br />{<br />	foreach ($val as $v)<br />	{<br />		if ($v != '.' && $v != '..')<br />		{<br />			$file = $root. '/' . $key . '/'. $v;<br />			$c = file_get_contents($file);<br />			$arr = explode("\n", $c);<br />			sort($arr);<br />			fputs($qq_done, implode("\n",$arr));<br />			unlink($file);<br />		}<br />	}<br />	rmdir($root. '/' . $key);<br />}<br />rmdir($root);<br /><br />echo  microtime(true)-$st;<br /><br />?><br />

总共大概花费了20多分钟。

虽然完成了，但方法很土鳖 0_0 ，坛里各位高手们改进改进啊。

------解决方案--------------------
来个C版本的

<br />#include <stdio.h><br /><br />#define BITSPERWORD 32<br />#define SHIFT 5<br />#define MASK 0x1F<br />#define N 100000000<br /><br />int a[1 + N/BITSPERWORD];<br /><br />void set(int i)<br />{<br />	a[i>>SHIFT] <br><font color='#FF8000'>------解决方案--------------------</font><br>= (1<<(i & MASK)); //i&MASK相当于1&(32-1)，即1%32<br />}<br /><br />void clr(int i)<br />{<br />	a[i>>SHIFT] &= ~(1<<(i & MASK));<br />}<br /><br />int test(int i)<br />{<br />	return a[i>>SHIFT] & (1<<(i & MASK));<br />}<br /><br />int main()<br />{<br />	int i;<br />	//初始化<br />	for(i = 0; i < N; i++)<br />		clr(i);<br /><br />	//读取文件，置位<br />	while(scanf("%d", &i) != EOF)<br />		set(i);<br /><br />	for(i = 0; i < N; i++)<br />		if(test(i))<br />			printf("%d\n", i);<br /><br />	return 0;<br />}<br />

------解决方案--------------------

既然有现成的数据文件，就没有必要去构造插入串了

set_time_limit(0);<br />$sql =<<< SQL<br />CREATE TABLE IF NOT EXISTS qq1 (<br />  `qq` int(10) NOT NULL,<br />  KEY `qq` (`qq`)<br />) ENGINE=MyISAM DEFAULT CHARSET=utf8;<br />SQL;<br /><br />mysql_connect('localhost', 'root', '');<br />mysql_select_db('test');<br />mysql_query($sql);<br /><br />$filename = str_replace('\\', '/', realpath('qq.txt'));<br />$sql =<<< SQL<br />LOAD DATA INFILE '$filename' INTO TABLE qq1<br />SQL;<br /><br />check_speed(1);<br />mysql_query($sql) or print(mysql_error());;<br />check_speed();<br />

时间: 182,955,851 微秒
内存: 664

<br>set_time_limit(0);<br>mysql_connect('localhost', 'root', '');<br>mysql_select_db('test');<br><br>echo '升序<br>';<br>$filename = str_replace('\\', '/', dirname(__FILE__) . '/qq_1.txt');<div class="clear">
                 
              
              
        
            </div>

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

PHP和Python：解释了不同的范例Apr 18, 2025 am 12:26 AM

PHP主要是过程式编程，但也支持面向对象编程（OOP）；Python支持多种范式，包括OOP、函数式和过程式编程。PHP适合web开发，Python适用于多种应用，如数据分析和机器学习。

PHP和Python：深入了解他们的历史Apr 18, 2025 am 12:25 AM

PHP起源于1994年，由RasmusLerdorf开发，最初用于跟踪网站访问者，逐渐演变为服务器端脚本语言，广泛应用于网页开发。Python由GuidovanRossum于1980年代末开发，1991年首次发布，强调代码可读性和简洁性，适用于科学计算、数据分析等领域。

在PHP和Python之间进行选择：指南Apr 18, 2025 am 12:24 AM

PHP适合网页开发和快速原型开发，Python适用于数据科学和机器学习。1.PHP用于动态网页开发，语法简单，适合快速开发。2.Python语法简洁，适用于多领域，库生态系统强大。

PHP和框架：现代化语言Apr 18, 2025 am 12:14 AM

PHP在现代化进程中仍然重要，因为它支持大量网站和应用，并通过框架适应开发需求。1.PHP7提升了性能并引入了新功能。2.现代框架如Laravel、Symfony和CodeIgniter简化开发，提高代码质量。3.性能优化和最佳实践进一步提升应用效率。

PHP的影响：网络开发及以后Apr 18, 2025 am 12:10 AM

PHPhassignificantlyimpactedwebdevelopmentandextendsbeyondit.1)ItpowersmajorplatformslikeWordPressandexcelsindatabaseinteractions.2)PHP'sadaptabilityallowsittoscaleforlargeapplicationsusingframeworkslikeLaravel.3)Beyondweb,PHPisusedincommand-linescrip

PHP类型提示如何起作用，包括标量类型，返回类型，联合类型和无效类型？Apr 17, 2025 am 12:25 AM

PHP类型提示提升代码质量和可读性。1)标量类型提示：自PHP7.0起，允许在函数参数中指定基本数据类型，如int、float等。2)返回类型提示：确保函数返回值类型的一致性。3)联合类型提示：自PHP8.0起，允许在函数参数或返回值中指定多个类型。4)可空类型提示：允许包含null值，处理可能返回空值的函数。