php百万级大数据量导出数据到excel,如何成功并高效导出?

最近公司项目要求把数据除了页面输出也希望有导出功能,虽然之前也做过几个导出功能,但这次数据量相对比较大,差不多一天数据就20W条,要求导7天或者30天…
关注者
132
被浏览
161,089

24 个回答

一、数据量分析

题主需要单日导入的数量为20W+

Excel2003版最大行数是65536行

Excel2007开始的版本最大行数是1048576行

所以需要使用的Excel版本为2007版本及以上,也就是后缀为.xlsx的Excel(除非题主拆分多个工作表)

以导出7天的数据量计算,大概在140W行数数据,超出最大行数限制,所以建议题主以每天来拆分工作表


二、目前PHP处理Excel的类库

PHPExcel - 官方不再维护

PHPOffice/PhpSpreadsheet - 建议使用


三、性能分析

代码可参考 PHPExcel与PhpSpreadsheet内存占用对比及使用缓存的影响


本机测试

20W行数据

数据有7列(1列约10个中文字符,其他列简单int)


运行环境:MacBook Pro A1502

CPU: Intel Core i5-4258U(2.4GHz/L3 3M)

内存容量: 8GB

PHP版本: 7.0.30

运行模式: CLI

PhpSpreadsheet版本: 1.3.1

PhpSpreadsheet配置:关闭预处理、未使用缓存


脚本运行时间:244秒

物理内存峰值:1008M(可以使用分段写入或使用缓存减少本机内存占用)

Excel文件大小:5M


补充:

  1. PhpSpreadsheet大数据写入Excel,建议关闭预处理
$writer = new \PhpOffice\PhpSpreadsheet\Writer\Html($spreadsheet);
$writer->setPreCalculateFormulas(false);

2.使用缓存

PhpSpreadsheet提供缓存功能,支持APCu、Redis、Memcache

以Redis为例

$client = new \Redis();