Heim  >  Artikel  >  Backend-Entwicklung  >  So schneiden Sie große Excel-Dateien mit PHP (vollständiger Code im Anhang)

So schneiden Sie große Excel-Dateien mit PHP (vollständiger Code im Anhang)

little bottle
little bottlenach vorne
2019-04-26 15:35:314497Durchsuche

In diesem Artikel geht es hauptsächlich um die Verwendung von PHP-Tabellen zum Schneiden großer Excel-Dateien. Ich hoffe, dass er Sie inspirieren kann.

Mit PHPSpreadsheet können Excel-Dateien problemlos analysiert werden, aber der Speicherverbrauch von PHPSpreadsheet ist auch relativ groß. Ich habe versucht, fast 5 MB reinen Text in Excel zu analysieren, und die Speichernutzung wird den standardmäßigen maximalen Speicher von PHP überschreiten 128M.
Natürlich kann dies durch Anpassen der Speichergröße gelöst werden, aber es ist gefährlicher, wenn die Parallelität groß ist. Deshalb werde ich heute die nächste Methode vorstellen: die Verwendung von PHP-Spreadsheet zum Ausschneiden von Excel-Dateien. Dies ist eine Methode, bei der Zeit gegen Platz ausgetauscht wird, sodass sie im Allgemeinen für geringe Aktualitätsanforderungen verwendet werden kann.

Methode:

Fügen Sie zunächst eine Funktion readCell ein, die von der offiziellen PHP-Spreadsheet-Website bereitgestellt wird. Mit dieser Funktion können wir das Schneiden durchführen.

Lesen Sie zunächst die Excel-Datei vor, hauptsächlich um alle Arbeitsblätter und die Anzahl der Datenzeilen unter dem Arbeitsblatt zu erhalten. Zu diesem Zeitpunkt gibt die readCell-Methode immer false zurück. Wir müssen nur das Arbeitsblatt aufzeichnen, das readCell enthält kommt herein. und die Anzahl der Datenzeilen.

Der nächste Schritt besteht darin, die erhaltenen Datensätze zu analysieren und zu bestimmen, wie viele Zeilen der Original-Excel-Daten in jeden Teil der Daten geladen werden müssen. Es ist zu beachten, dass zur Vermeidung von Inhaltsverwirrungen nicht geschnitten wird Tragen Sie den Inhalt der beiden Arbeitsblätter zusammen.

Der letzte Schritt besteht darin, die analysierten Daten zu durchlaufen und readCell erneut zu verwenden, um jeden Teil der Daten abzurufen. Beachten Sie, dass jedes Mal, wenn die Datei gelesen wird, die Methode „disconnectWorksheets“ verwendet werden muss, um den Speicher von phpspreadsheet zu bereinigen .

Nach meinen eigenen Tests habe ich herausgefunden, dass die Verwendung dieser Methode zum Parsen einer 5 MB großen Excel-Datei nur durchschnittlich 21 MB Speicher erfordert!

Code

<?php    
namespace CutExcel;    
require_once &#39;PhpSpreadsheet/autoload.php&#39;;    
/**    
 * 预读过滤类    
 * @author wangyelou     
 * @date 2018-07-30    
 */    
class MyAheadreadFilter implements \PhpOffice\PhpSpreadsheet\Reader\IReadFilter    
{    
    public $record = array();    
    private $lastRow = &#39;&#39;;    
    public function readCell($column, $row, $worksheetName = &#39;&#39;)     
    {    
        if (isset($this->record[$worksheetName]) ) {    
            if ($this->lastRow != $row) {    
                $this->record[$worksheetName] ++;           
                $this->lastRow = $row;    
            }     
        } else {    
            $this->record[$worksheetName] = 1;           
            $this->lastRow = $row;    
        }    
        return false;    
    }    
}    
/**    
 * 解析过滤类    
 * @author wangyelou     
 * @date 2018-07-30    
 */    
class MyreadFilter implements \PhpOffice\PhpSpreadsheet\Reader\IReadFilter    
{    
    public $startRow;    
    public $endRow;    
    public $worksheetName;    
    public function readCell($column, $row, $worksheetName = &#39;&#39;)     
    {    
        if ($worksheetName == $this->worksheetName && $row >= ($this->startRow+1) && $row <= ($this->endRow+1)) {    
            return true;    
        }    
        return false;    
    }    
}    
/**    
 * 切割类    
 * @author wangyelou     
 * @date 2018-07-30    
 */    
class excelCut    
{    
    public $cutNum = 5;    
    public $returnType = &#39;Csv&#39;;    
    public $fileDir = &#39;/tmp/&#39;;    
    public $log;    
    /**    
     * 切割字符串    
     * @param $str    
     * @return array|bool    
     */    
    public function cutFromStr($str)    
    {    
        try {    
            $filePath = &#39;/tmp/&#39; . time() . mt_rand(1000, 9000) . $this->returnType;    
            file_put_contents($filePath, $str);    
            if (file_exists($filePath)) {    
                $result =  $this->cutFromFile($filePath);    
                unlink($filePath);    
                return $result;    
            } else {    
                throw new Exception(&#39;文件写入错误&#39;);    
            }    
        } catch (Exception $e) {    
            $this->log = $e->getMessage();    
            return false;    
        }    
    }    
    /**    
     * 切割文件    
     * @param $file    
     * @return array|bool    
     */    
    public function cutFromFile($file)    
    {    
        try {    
            $cutRules = $this->readaheadFromFile($file);    
            $dir = $this->getFileDir($file);    
            $returnType = $this->returnType ? $this->returnType : &#39;Csv&#39;;    
            $results = array();    
            //初始化读    
            $myFilter = new MyreadFilter();    
            $inputFileType = \PhpOffice\PhpSpreadsheet\IOFactory::identify($file);    
            $reader = \PhpOffice\PhpSpreadsheet\IOFactory::createReader($inputFileType);    
            $reader->setReadDataOnly(true);    
            $reader->setReadFilter($myFilter);    
            foreach ($cutRules as $sheetName => $rowIndexRange) {    
                //读    
                list($myFilter->startRow, $myFilter->endRow, $myFilter->worksheetName) = $rowIndexRange;    
                $spreadsheetReader = $reader->load($file);    
                $sheetData = $spreadsheetReader->setActiveSheetIndexByName($myFilter->worksheetName)->toArray(null, false, false, false);    
                $realDatas = array_splice($sheetData, $myFilter->startRow, ($myFilter->endRow - $myFilter->startRow + 1));    
                $spreadsheetReader->disconnectWorksheets();    
                unset($sheetData);    
                unset($spreadsheetReader);    
                //写    
                $saveFile = $dir . $sheetName . &#39;.&#39; . $returnType;    
                $spreadsheetWriter = new \PhpOffice\PhpSpreadsheet\Spreadsheet();    
                foreach ($realDatas as $rowIndex => $row) {    
                    foreach ($row as $colIndex => $col) {    
                        $spreadsheetWriter->getActiveSheet()->setCellValueByColumnAndRow($colIndex+1, $rowIndex+1, $col);    
                    }    
                }    
                $writer = \PhpOffice\PhpSpreadsheet\IOFactory::createWriter($spreadsheetWriter, $returnType);    
                $writer->save($saveFile);    
                $spreadsheetWriter->disconnectWorksheets();    
                unset($spreadsheetWriter);    
                $results[] = $saveFile;    
            }    
            return $results;    
        } catch (Exception $e) {    
            $this->log = $e->getMessage();    
            return false;    
        }    
    }    
    /**    
     * 预读文件    
     */    
    public  function readaheadFromFile($file)    
    {    
        if (file_exists($file)) {    
            //获取统计数据    
            $myFilter = new MyAheadreadFilter();    
            $inputFileType = \PhpOffice\PhpSpreadsheet\IOFactory::identify($file);    
            $reader = \PhpOffice\PhpSpreadsheet\IOFactory::createReader($inputFileType);    
            $reader->setReadDataOnly(true); //只读数据    
            $reader->setReadFilter($myFilter);    
            $spreadsheet = $reader->load($file);    
            //$sheetData = $spreadsheet->getActiveSheet()->toArray(null, false, false, false);    
            list($fileName,) = explode(&#39;.&#39;, basename($file));    
            $datas = array();    
            $averageNum = ceil(array_sum($myFilter->record) / $this->cutNum);    
            foreach ($myFilter->record as $sheetName => $count) {    
                for ($i=0; $i<ceil($count/$averageNum); $i++) {    
                    $datas[$fileName . &#39;_&#39; . $sheetName . &#39;_&#39; . $i] = array($i*$averageNum, ($i+1)*$averageNum-1, $sheetName);    
                }    
            }    
            return $datas;    
        } else {    
            throw new Exception($file . &#39; not exists&#39;);    
        }    
    }    
    /**    
     * 创建目录    
     * @param $file    
     * @return bool|string    
     */    
    protected function getFileDir($file)    
    {    
        $baseName = basename($file);    
        list($name) = explode(&#39;.&#39;, $baseName);    
        $fullName = $name .&#39;_&#39;. time() . &#39;_&#39; . mt_rand(1000, 9999);    
        $path = $this->fileDir . $fullName . &#39;/&#39;;    
        mkdir($path, 0777);    
        chmod($path, 0777);    
        if (is_dir($path)) {    
            return $path;    
        } else {    
            $this->log = "mkdir {$path} failed";    
            return false;    
        }    
    }    
}

Verwandte Tutorials: PHP-Video-Tutorial

Das obige ist der detaillierte Inhalt vonSo schneiden Sie große Excel-Dateien mit PHP (vollständiger Code im Anhang). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:cnblogs.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen