検索
ホームページバックエンド開発PHPの問題PHPを使用してExcelデータを大規模なバッチでエクスポートする方法

在平时生活或其他时候,我们可能会需要大批量导出excel数据,所以将这次的优化过程发布出来,希望对有需要的同学启到一定的帮助。

PHPを使用してExcelデータを大規模なバッチでエクスポートする方法

项目后台有导出几 w 条数据生成 excel 的功能,刚好前同事的方法直接报内存溢出错误,
所以将这次的优化过程发布出来,希望对有需要的同学启到一定的帮助

先看优化后效果:

PHPを使用してExcelデータを大規模なバッチでエクスポートする方法

异步生成数据且真实进度条反馈进度

PHPを使用してExcelデータを大規模なバッチでエクスポートする方法

2.进度完成,前端 js 跳转到下载地址

PHPを使用してExcelデータを大規模なバッチでエクスポートする方法

3.生成 csv 文件代替 excel , 3.5w 条数据文件大小 8M

原代码报错信息

[2020-09-27 09:21:13] local.ERROR: Allowed memory size of 536870912 bytes exhausted (tried to allocate 8192 bytes) {"userId":1,"exception":"[object] (Symfony\\Component\\Debug\\Exception\\FatalErrorException(code: 1): Allowed memory size of 536870912 bytes exhausted (tried to allocate 8192 bytes) at /Users/****/WebRoot/ValeSite/****/vendor/laravel/framework/src/Illuminate/Database/Eloquent/Concerns/HasAttributes.php:879)

原代码逻辑

$list = Good::with(['good_standard', 'good_standard.default_picture',  'good_standard.brand'])
......
->selectRaw('goods.*')~~~~
->get();
#内存溢出点 1, 该 orm 返回数据量为 3.5w 行数据
...... ~~~~
$list = $this->goodsRepository->batchGetFullGoodsScope($list);
foreach ($list as $item) {
   $cell = [];
   .....
   //没条数组共 30 个元素   
   $cellData[] = $cell;
}
# 内存溢出点 2 ,生成需要的数据,3w + 条数据时,内存消耗大概在 110M +

.....
Excel::create(...)
#内存溢出点 3 , Maatwebsite/Laravel-Excel库大批量生成也会内存溢出

# 和直观的代码处理流,该代码在小数据量时无问题

解决思路分析

  1. orm 取数据优化 (mysql)

  2. 对已获取的 orm 数据二次处理后 , 数据存储优化

  3. 导出 excel 时, 导出优化

后续所有的代码功能都是围绕该 3 个方向来处理


方案 1 (异步生成数据 )

思路分析:

前端 ajax 发送 excel 导出请求  ->后端结束请求且计算数据总条数, 按一定倍数拆分成多次 job 生成数据 ->后端多个进程异步执行 job 队列任务,按批次生成数据 (每次执行计数一次,数据写入 redis) ->前端 ajax 轮询获取总次数和当前已执行次数 (计算出进度条 ) ->前端获 ajax 轮询结果总次数 = 已执行次数 ~~~~(进度100%),跳转到下载地址 ->后端 redis 取数据,渲染生成 csv 文件(下载完成)

代码实现:

前端代码: jquery + Bootstrap

# 进度条样式,可在 bootstrap 找到
<section class="panel" id="export_loading_box">
    <p class="panel-body m-b-10" style="display: none">
        <p class="text-muted">
            数据导出中 .....
        </p>
        <p class="progress progress-striped active">
            <p class="progress-bar progress-bar-info"
 role="progressbar"
 aria-valuemin="0"
 aria-valuemax="100"
 style="width: 0%">
                0%
            </p>
        </p>
    </p>
</section>
$(function () {
    $(&#39;.down-list&#39;).click(function () {
        let formName = $(this).attr(&#39;data-form&#39;)
        let data = $(&#39;#&#39; + formName).serialize();
        OE.params.url = $(this).attr(&#39;data-url&#39;);
        OE.handle(data);
    });
})
//商品导出 JS 控件
let OE = window.OE || {}
OE = {
    params: {
        ifRun: 0,
        url: &#39;&#39;,
        cachePre: &#39;&#39;,
    },
    # 1. 前端 ajax 发送 excel导出请求
    handle: function (formData) {
        if (OE.params.ifRun) {
            return false;
        }
        OE.params.ifRun = 1;
        OE.rateShow(100, 0);
        $(&#39;#export_loading_box&#39;).find(&#39;.panel-body&#39;).show();
        $.getJSON(OE.params.url, formData + &#39;&run=1&#39;, function (data) {
            if (200 == data.status) {
                OE.params.cachePre =  data.cachePre;
                //请求成功, 渲染进度条
                OE.init();
            } else {
                OE.showAlert(false, data.msg);
            }
        })
    },
    # 4. ajax 轮询渲染进度条
    init: function () {
        let t = setInterval(function () {
            $.getJSON(OE.params.url, "get_run=1&cache_pre="+OE.params.cachePre, function (data) {
                OE.rateShow(data.total, data.run);
                if (200 == data.status && data.total == data.run) {
                    clearInterval(t);
                    OE.params.ifRun = 0;
                    OE.showAlert(true);
                    //跳转下载 excel
 window.location.href = OE.params.url+&#39;?cache_pre=&#39;+OE.params.cachePre;
                    return;
                }
            });
        }, 2000);
    },
    showAlert: function (success, msg) {
        if (success) {
            html = &#39;<p class="alert alert-success fade in">&#39; +
                &#39;       <button data-dismiss="alert" class="close close-sm" type="button">&#39; +
                &#39;           <i class="fa fa-times"></i>&#39; +
                &#39;       </button>&#39; +
                &#39;       <strong>导出成功</strong> 数据下载中&#39; +
                &#39; </p>&#39;;
        }
        $(&#39;#export_loading_box&#39;).append(html);
        $(&#39;#export_loading_box&#39;).find(&#39;.panel-body&#39;).hide();
    },
    # 进度条计算
    rateShow: function (total, run) {
        let width = ((run / total) * 100).toFixed(0);
        $(&#39;#export_loading_box&#39;).find(&#39;.progress-bar&#39;).css(&#39;width&#39;, width + &#39;%&#39;);
        $(&#39;#export_loading_box&#39;).find(&#39;.progress-bar&#39;).text(width + &#39;% &#39;);
    }
}

后端代码 :

2.后端总入口

// 前端第一次请求触发代码实现
$listOrm = self::getGoodOrm();

//求总,初始化 job 数据
$total = $listOrm->count();
for ($page = 0; $page <= ($totalPage - 1); $page++) {
            //创建子队列
            CreateExportGoodData::dispatch($requestData, $page, $authAdmin->id, $cachePre)
                ->onQueue(self::JOB_QUEUE);
 }

3.后端异步子队列执行任务 (和前端无关)

self::$requestData = $requestData;
$listOrm = self::getGoodOrm();
$list = $listOrm->offset($page * self::PAGE_NUM)
 ->limit(self::PAGE_NUM)
 ->orderByDesc(&#39;goods.id&#39;)
 ->get();
 
 //数据清洗过程
 ......
 
 //执行次数递增 1
Redis::incr(self::GE_RUN_KEY . $cachePre . &#39;:&#39; . $adminId);
//清洗后的数据压入 redis 列表
Redis::lpush(self::GE_DATA_KEY . $cachePre . &#39;:&#39; . $adminId, serialize($data));

4.后端实现前端 ajax 轮询执行进度反馈代码实现

$total = Redis::get(GoodsExportRepository::GE_TOTAL_KEY. $cachePre. &#39;:&#39;. $authAdmin->id);
$run = Redis::get(GoodsExportRepository::GE_RUN_KEY. $cachePre. &#39;:&#39;. $authAdmin->id);
if ($request->input(&#39;get_run&#39;)) {
 //前端 ajax 轮询获取同步已运行队列数
 return [&#39;status&#39; => 200, &#39;total&#39; => $total, &#39;run&#39; => $run];
}

6.后端实现前端 excel 下载代码实现

$fileName = "商品导出" . date(&#39;Y-m-d&#39;);
header(&#39;Content-Type: application/vnd.ms-excel&#39;);
header(&#39;Content-Disposition: attachment;filename="&#39; . $fileName . &#39;.csv"&#39;);
header(&#39;Cache-Control: max-age=0&#39;);
//开启预输出流
$fp = fopen(&#39;php://output&#39;, &#39;a&#39;);

//输出商品列表数据
while (true) {
    //核心1 从 redis 列表里依次取数据
    $data = Redis::rpop(self::GE_DATA_KEY . $cachePre . &#39;:&#39; . $adminId);
    if (!$data) {
        // redis 列表数据为空,结束 while 循环
        break;
    } 
    //核心2 
    ob_flush(); //取出 $fb 输出流 存入 buffer 内数据
    flush();    //直接渲染至 http 数据流至浏览器
    $data = unserialize($data);
    foreach ($data as $row) {
        foreach ($row as $key => $value) {
            if (is_string($value)) {
               $row[$key] = iconv(&#39;utf-8&#39;, &#39;gbk//IGNORE&#39;, $value);
            } 
        } 
        fputcsv($fp, $row);
    }
 }
fclose($fp);
//必须 exit 阻止框架继续输出
exit();

至此,异步导出 excel 已完成

总结:

  • 后端队列任务生产数据录入 redis list

  • 前端 ajax 轮询获取执行情况

  • 前端 获取后端已将所有 队列任务执行, 跳转至下载地址

  • 下载地址取 redis 内数据,渲染成 csv 文件

优点:

  • 异步多队列进程执行,效率高

  • 前端可实时获取执行进度, 用户体验好

缺点:

  • ajax 轮询占用正常用户请求资源,该方案只适合后台实现

  • 代码复杂, 施工人员需一定的 laravel 队列知识和 前端知识储备;对自己把握不足的同学可直接看第二种解决方案


方案 2 (同步生成数据 )

思路分析:
  • 设置 php 脚本时间 set_time_limit(0);

  • orm 依次获取数据,对获取的数据直接清洗后直接写入 输出流, 输出至浏览器

代码实现:

set_time_limit(0)

//直接输出头部声明
$fileName = "商品导出" . date(&#39;Y-m-d&#39;);
header(&#39;Content-Type: application/vnd.ms-excel&#39;);
header(&#39;Content-Disposition: attachment;filename="&#39; . $fileName . &#39;.csv"&#39;);
header(&#39;Cache-Control: max-age=0&#39;);

//开启输出流
$fp = fopen(&#39;php://output&#39;, &#39;a&#39;);

// while 循环取数据
$page = 0;
while (true) {
    $listOrm = self::getGoodOrm();
    $list = $listOrm->offset($page * self::PAGE_NUM)
            ->limit(self::PAGE_NUM)
            ->orderByDesc(&#39;goods.id&#39;)
            ->get();
  if ($list->isEmpty()) {
    //无数据时退出 while 循环
    break;
  }
  //数据清洗
  $data = ..... 
  
  //直接将清洗后的 $data 数据写入输出流
  foreach ($data as $row) {
        foreach ($row as $key => $value) {
            if (is_string($value)) {
                  $row[$key] = iconv(&#39;utf-8&#39;, &#39;gbk//IGNORE&#39;, $value);
            }
        }
        fputcsv($fp, $row);
   }
  
  //输出至浏览器
  ob_flush();
  flush(); 
}
 fclose($fp);
 exit();

总结

  • 优点: 代码流程简单,开发难度低

  • 缺点: 前端体验差, ( 数据单进程获取,效率低) 下载等待耗时长 )


不管是异步还是同步, 实际思路都是分页获取数据, 对分页获取的数据进行处理; 都有用到核心方法:

fopen(&#39;php://output&#39;, &#39;a&#39;) , 
ob_flush(), 
flush();

推荐学习:php视频教程

以上がPHPを使用してExcelデータを大規模なバッチでエクスポートする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事はsegmentfaultで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
es6数组怎么去掉重复并且重新排序es6数组怎么去掉重复并且重新排序May 05, 2022 pm 07:08 PM

去掉重复并排序的方法:1、使用“Array.from(new Set(arr))”或者“[…new Set(arr)]”语句,去掉数组中的重复元素,返回去重后的新数组;2、利用sort()对去重数组进行排序,语法“去重数组.sort()”。

JavaScript的Symbol类型、隐藏属性及全局注册表详解JavaScript的Symbol类型、隐藏属性及全局注册表详解Jun 02, 2022 am 11:50 AM

本篇文章给大家带来了关于JavaScript的相关知识,其中主要介绍了关于Symbol类型、隐藏属性及全局注册表的相关问题,包括了Symbol类型的描述、Symbol不会隐式转字符串等问题,下面一起来看一下,希望对大家有帮助。

原来利用纯CSS也能实现文字轮播与图片轮播!原来利用纯CSS也能实现文字轮播与图片轮播!Jun 10, 2022 pm 01:00 PM

怎么制作文字轮播与图片轮播?大家第一想到的是不是利用js,其实利用纯CSS也能实现文字轮播与图片轮播,下面来看看实现方法,希望对大家有所帮助!

JavaScript对象的构造函数和new操作符(实例详解)JavaScript对象的构造函数和new操作符(实例详解)May 10, 2022 pm 06:16 PM

本篇文章给大家带来了关于JavaScript的相关知识,其中主要介绍了关于对象的构造函数和new操作符,构造函数是所有对象的成员方法中,最早被调用的那个,下面一起来看一下吧,希望对大家有帮助。

JavaScript面向对象详细解析之属性描述符JavaScript面向对象详细解析之属性描述符May 27, 2022 pm 05:29 PM

本篇文章给大家带来了关于JavaScript的相关知识,其中主要介绍了关于面向对象的相关问题,包括了属性描述符、数据描述符、存取描述符等等内容,下面一起来看一下,希望对大家有帮助。

javascript怎么移除元素点击事件javascript怎么移除元素点击事件Apr 11, 2022 pm 04:51 PM

方法:1、利用“点击元素对象.unbind("click");”方法,该方法可以移除被选元素的事件处理程序;2、利用“点击元素对象.off("click");”方法,该方法可以移除通过on()方法添加的事件处理程序。

foreach是es6里的吗foreach是es6里的吗May 05, 2022 pm 05:59 PM

foreach不是es6的方法。foreach是es3中一个遍历数组的方法,可以调用数组的每个元素,并将元素传给回调函数进行处理,语法“array.forEach(function(当前元素,索引,数组){...})”;该方法不处理空数组。

整理总结JavaScript常见的BOM操作整理总结JavaScript常见的BOM操作Jun 01, 2022 am 11:43 AM

本篇文章给大家带来了关于JavaScript的相关知识,其中主要介绍了关于BOM操作的相关问题,包括了window对象的常见事件、JavaScript执行机制等等相关内容,下面一起来看一下,希望对大家有帮助。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール