ホームページ  >  記事  >  バックエンド開発  >  1億QQ番号をソートするPHPを解決する方法

1億QQ番号をソートするPHPを解決する方法

WBOY
WBOYオリジナル
2016-06-13 12:58:01876ブラウズ

PHP 1億QQ番号並べ替え
食べたり飲んだりした後、私も投稿しました。
何千もの部分に分割し、並べ替えて再度結合します。


まず、1億個のQQ番号を含むtxtを作成します。

<br />
<?php<br />
<br />
// 创建一亿个QQ号的txt (大约需85~100秒)<br />
<br />
set_time_limit(0);<br />
$fn = 'qq.txt';<br />
$fp = fopen($fn, 'w');<br />
<br />
$st = microtime(true);<br />
<br />
$l = range(0,10000);<br />
shuffle($l);<br />
foreach ($l as $k=>$v)<br />
{<br />
	$arr = range($v*10000+10000,10000*($v+1)+9999);<br />
	shuffle($arr);<br />
	fputs($fp,implode("\n", $arr)."\n");<br />
	unset($arr);<br />
}<br />
<br />
echo  microtime(true)-$st;<br />
<br />
?><br />




1 億個のランダムな QQ の作成が完了するまで 1 ~ 2 分待ちます。

QQ 番号の範囲は >10000 です。ファイルサイズは約840MBです。



次に、それを数千の文書に分類して分割します。

QQ 番号の長さがフォルダーとして使用され、QQ 番号の最初の 3 桁がファイル名として使用されます。

<br />
<?php<br />
<br />
// 长度号码分类 (大约需360~400秒)<br />
<br />
set_time_limit(0);<br />
$st = microtime(true);<br />
<br />
if(!is_dir('qq_no')) mkdir('qq_no');<br />
$file = fopen('qq.txt', 'r'); <br />
<br />
<br />
$i=0;<br />
$end_s = '';<br />
while(!feof($file))<br />
{<br />
	$g = 1042*1024;<br />
	fseek($file,$g*$i);<br />
	$s = fread($file, $g);<br />
<br />
 	<br />
	$end = strrpos($s, "\n");<br />
	$arr_s = $end_s.substr($s, 0, $end);<br />
	$end_s = substr($s, $end);<br />
<br />
	$arr = explode("\n", $arr_s);<br />
	foreach ($arr as $k=>$v)<br />
	{<br />
		if($v!='')<br />
		{<br />
			$tag = "$v[0]$v[1]$v[2]";<br />
			$text_arr[strlen($v)][$tag][] = $v;<br />
		}<br />
	}<br />
<br />
	foreach ($text_arr as $k=>$v)<br />
	{<br />
		$n_dir = 'qq_no/'.$k;<br />
		if (!is_dir($n_dir)) mkdir($n_dir);<br />
		foreach ($v as $tag=>$val)<br />
		{<br />
			$n_tf = fopen($n_dir.'/'.$tag.'.txt', 'a+');<br />
			fputs($n_tf,implode("\n",$val)."\n");<br />
		}<br />
		<br />
		<br />
	}<br />
	unset($text_arr);<br />
<br />
	++$i;<br />
<br />
}<br />
<br />
echo  microtime(true)-$st;<br />
<br />
?><br />




最後に、各ファイルが並べ替えられてマージされます。

<br />
<?php<br />
<br />
// 排序完成拉 (800~920秒)<br />
<br />
set_time_limit(0);<br />
$st = microtime(true);<br />
<br />
$qq_done = fopen('qq_done.txt', 'a+');<br />
<br />
$root = 'qq_no';<br />
$dir_array = scandir($root);<br />
<br />
foreach ($dir_array as $key=>$val)<br />
{<br />
	if ($val != '.' && $val != '..')<br />
		$dirs[$val] =  scandir($root.'/'.$val);<br />
}<br />
<br />
<br />
foreach ($dirs as $key=>$val)<br />
{<br />
	foreach ($val as $v)<br />
	{<br />
		if ($v != '.' && $v != '..')<br />
		{<br />
			$file = $root. '/' . $key . '/'. $v;<br />
			$c = file_get_contents($file);<br />
			$arr = explode("\n", $c);<br />
			sort($arr);<br />
			fputs($qq_done, implode("\n",$arr));<br />
			unlink($file);<br />
		}<br />
	}<br />
	rmdir($root. '/' . $key);<br />
}<br />
rmdir($root);<br />
<br />
echo  microtime(true)-$st;<br />
<br />
?><br />



合計20分ほどかかりました。

完成しましたが、このメソッドは非常に素朴な 0_0 なので、フォーラムのすべての専門家がそれを改善することができます。

-----解決策--------------------------------
C バージョンをお試しください

<br>
#include <stdio.h><br>
<br>
#define ビットパーワード 32<br>
#SHIFT 5 を定義<br>
#define MASK 0x1F<br>
#define N 100000000<br>
<br>
int a[1 + N/BITSPERWORD];<br>
<br>
void set(int i) <div class="clear"></div></stdio.h>
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。