php排序1亿个QQ号码解决方案 -php教程-PHP中文網

首頁

後端開發

php教程

php排序1亿个QQ号码解决方案

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 pm 01:50 PM

amparrforeachquot

php排序1亿个QQ号码
吃饱喝足了，还发贴了。
拆开分成几千份进行排序再合并。

首先先创建一个1亿个QQ号的txt。

PHP code

<!--

Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/

-->
<?php // 创建一亿个QQ号的txt (大约需85~100秒)

set_time_limit(0);
$fn = 'qq.txt';
$fp = fopen($fn, 'w');

$st = microtime(true);

$l = range(0,10000);
shuffle($l);
foreach ($l as $k=>$v)
{
    $arr = range($v*10000+10000,10000*($v+1)+9999);
    shuffle($arr);
    fputs($fp,implode("\n", $arr)."\n");
    unset($arr);
}

echo  microtime(true)-$st;

?>

稍等一两分钟1亿个随机QQ创建完成了。

QQ号码范围为>10000。文件大小大概有840MB。

下面就进行分类划分成几千份文件。

以QQ号码长度为文件夹，QQ号码前3位为文件名。

PHP code

<!--

Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/

-->
<?php // 长度号码分类 (大约需360~400秒)

set_time_limit(0);
$st = microtime(true);

if(!is_dir('qq_no')) mkdir('qq_no');
$file = fopen('qq.txt', 'r'); 


$i=0;
$end_s = '';
while(!feof($file))
{
    $g = 1042*1024;
    fseek($file,$g*$i);
    $s = fread($file, $g);

     
    $end = strrpos($s, "\n");
    $arr_s = $end_s.substr($s, 0, $end);
    $end_s = substr($s, $end);

    $arr = explode("\n", $arr_s);
    foreach ($arr as $k=>$v)
    {
        if($v!='')
        {
            $tag = "$v[0]$v[1]$v[2]";
            $text_arr[strlen($v)][$tag][] = $v;
        }
    }

    foreach ($text_arr as $k=>$v)
    {
        $n_dir = 'qq_no/'.$k;
        if (!is_dir($n_dir)) mkdir($n_dir);
        foreach ($v as $tag=>$val)
        {
            $n_tf = fopen($n_dir.'/'.$tag.'.txt', 'a+');
            fputs($n_tf,implode("\n",$val)."\n");
        }
        
        
    }
    unset($text_arr);

    ++$i;

}

echo  microtime(true)-$st;

?>

最后就要每个文件进行排序合并数据了。

PHP code

<!--

Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/

-->
<?php // 排序完成拉 (800~920秒)

set_time_limit(0);
$st = microtime(true);

$qq_done = fopen('qq_done.txt', 'a+');

$root = 'qq_no';
$dir_array = scandir($root);

foreach ($dir_array as $key=>$val)
{
    if ($val != '.' && $val != '..')
        $dirs[$val] =  scandir($root.'/'.$val);
}


foreach ($dirs as $key=>$val)
{
    foreach ($val as $v)
    {
        if ($v != '.' && $v != '..')
        {
            $file = $root. '/' . $key . '/'. $v;
            $c = file_get_contents($file);
            $arr = explode("\n", $c);
            sort($arr);
            fputs($qq_done, implode("\n",$arr));
            unlink($file);
        }
    }
    rmdir($root. '/' . $key);
}
rmdir($root);

echo  microtime(true)-$st;

?>

总共大概花费了20多分钟。

虽然完成了，但方法很土鳖 0_0 ，坛里各位高手们改进改进啊。

------解决方案--------------------
来个C版本的

C/C++ code


#include <stdio.h>

#define BITSPERWORD 32
#define SHIFT 5
#define MASK 0x1F
#define N 100000000

int a[1 + N/BITSPERWORD];

void set(int i)
{
    a[i>>SHIFT] |= (1>SHIFT] &= ~(1>SHIFT] & (1<font color="#e78608">------解决方案--------------------</font><br>
<br>既然有现成的数据文件，就没有必要去构造插入串了<br><dl class="code">PHP code<pre class="brush:php;toolbar:false">
set_time_limit(0);
$sql =

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

Java ArrayList遍历时使用foreach和iterator删除元素的区别是什么？Apr 27, 2023 pm 03:40 PM

一、Iterator和foreach的区别多态差别(foreach底层就是Iterator)Iterator是一个接口类型，他不关心集合或者数组的类型;for和foreach都需要先知道集合的类型，甚至是集合内元素的类型;1.为啥说foreach底层就是Iterator编写的代码：反编译代码：二、foreach与iterator时remove的区别先来看阿里java开发手册但1的时候不会报错，2的时候就会报错(java.util.ConcurrentModificationException)首

php如何判断foreach循环到第几个Jul 10, 2023 pm 02:18 PM

php判断foreach循环到第几个的步骤：1、创建一个“$fruits”的数组；2、创建一个计数器变量“$counter”初始值为0；3、使用“foreach”循环遍历数组，并在循环体中增加计数器变量的值，再输出每个元素和它们的索引；4、在“foreach”循环体外输出计数器变量的值，以确认循环到了第几个元素。

PHP返回一个键值翻转后的数组Mar 21, 2024 pm 02:10 PM

这篇文章将为大家详细讲解有关PHP返回一个键值翻转后的数组，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。PHP键值翻转数组键值翻转是一种对数组进行的操作，它将数组中的键和值进行交换，生成一个新的数组，其中原始键作为值，原始值作为键。实现方法在php中，可以通过以下方法对数组进行键值翻转：array_flip()函数：array_flip()函数专门用于键值翻转操作。它接收一个数组作为参数，并返回一个新的数组，其中键和值已交换。$original_array=[

AMP是什么币？Feb 24, 2024 pm 09:16 PM

什么是AMP币？AMP代币是由Synereo团队于2015年创立，作为Synereo平台的主要交易货币。AMP代币旨在通过多种功能和用途，为用户提供更好的数字经济体验。AMP代币的用途AMP代币在Synereo平台中拥有多重角色和功能。首先，作为平台的加密货币奖励系统的一部分，用户能够通过分享和推广内容来获得AMP奖励，这一机制鼓励用户更积极地参与平台的活动。AMP代币还可用于在Synereo平台上推广和传播内容。用户可以通过使用AMP代币提升他们的内容在平台上的曝光率，以吸引更多观众来查看和分

php提交表单通过后,弹出的对话框怎样在当前页弹出,该如何解决Jun 13, 2016 am 10:23 AM

php提交表单通过后,弹出的对话框怎样在当前页弹出php提交表单通过后,弹出的对话框怎样在当前页弹出而不是在空白页弹出？想实现这样的效果：而不是空白页弹出:------解决方案--------------------如果你的验证用PHP在后端，那么就用Ajax；仅供参考：HTML code<form name="myform"

PHP返回数组中的当前元素Mar 21, 2024 pm 12:36 PM

这篇文章将为大家详细讲解有关PHP返回数组中的当前元素，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。获取PHP数组中的当前元素php为访问和操作数组提供了多种方法，其中包括获取数组中的当前元素。以下介绍几种常用的技术：1.current()函数current()函数返回数组内部指针当前指向的元素。指针最初指向数组的第一个元素。使用以下语法：$currentElement=current($array);2.key()函数key()函数返回数组内部指针当前指向元

foreach和for循环的区别是什么Jan 05, 2023 pm 04:26 PM

区别：1、for通过索引来循环遍历每一个数据元素，而forEach通过JS底层程序来循环遍历数组的数据元素；2、for可以通过break关键词来终止循环的执行，而forEach不可以；3、for可以通过控制循环变量的数值来控制循环的执行，而forEach不行；4、for在循环外可以调用循环变量，而forEach在循环外不能调用循环变量；5、for的执行效率要高于forEach。

如何使用forEach函数遍历对象的属性？Nov 18, 2023 pm 06:10 PM

如何使用forEach函数遍历对象的属性？在JavaScript中，我们经常需要对对象的属性进行遍历操作。如果你想使用一种简洁的方法来遍历对象的属性，forEach函数是一个非常好的选择。在本文中，我们将介绍如何使用forEach函数来遍历对象的属性，并提供具体的代码示例。首先，让我们来了解一下forEach函数的基本用法。forEach函数是Java

See all articles