使用PHPExcel读写excel
转载请注明文章出处:https://tlanyan.me/use-phpexc...
PHPOffice出品的PHPExcel是PHP读取和生成Excel的极佳工具。本文参考官方文档,对PHPExcel进行简要总结,希望对使用PHPExcel操作Excel的同行有帮助。
PHPExcel介绍
PHPExcel是用PHP实现的电子表格文档读写类库,其支持的文档类型包括:Excel(.xls)后缀,Excel 2007(.xlsx后缀),CSV(.csv后缀),LibreOffice Calc(.ods后缀),PDF和HTML等格式(某些格式只能读)。PHPExcel运行环境为PHP 5.2+,需要开启php_zip、php_xml和php_gd2拓展。
细心的读者可能看到PHPOffice有另外一款作品:PHPSpreadsheet。PHPSpreadsheet也是一个Excel读写类库,与PHPExcel主要区别是:
- PHPSpreadsheet是PHPExcel的重构版,基于PHP的新特性进行了重写。PHPSpreadsheet要求PHP 5.6+,使用了名字空间、PSR2编码规范、最新的PHP语言新特性;
- 对PHP版本的要求加强。官方的PHP版本支持结束后,PHPSpreadsheet对该版本至多额外支持6个月(意味肯定不支持PHP 5.5及以下版本,PHP5.6的支持也即将终止)。对比之下,PHPExcel依然支持PHP 5.2.0;
- 开发组已将所有资源转移到PHPSpreadsheet,PHPExcel的维护已经停止。
PHPSpreadsheet已经放出1.0.0稳定版,官方不再建议使用PHPExcel。本文内容主要讲解PHPExcel,掌握透彻后再转换到PHPSpreadsheet也是很容易的。
PHPExcel架构
理解PHPExcel的架构,可以先从理解Excel文件的结构开始。一个Excel文件包含多个表单,每个表单包含多个单元;文件、表单和单元都可以单独设置属性。这些概念对应到PHPExcel中的类,关系如下:
- PHPExcel类 < -> Excel文件
- PHPExcel_Worksheet类 < -> 表单
- PHPExcel_Cell < -> 单元
- PHPExcel_DocumentProperties < -> 文件属性
- PHPExcel_Style_* < -> 格式设置类
下面开始介绍PHPExcel的常用操作。
使用PHPExcel
根据上面介绍的关系,分excel文件、表单、单元、格式设置四个部分分别介绍PHPExcel的使用方法。
excel文件
一个PHPExcel类的实例代表一个excel文件。新生成的PHPExcel对象,经常需要保存为文件;反之excel文件常需要导入为PHPExcel实例。保存和导入的行为分别由writer和reader负责。为了正确导入和保存数据,reader和writer需要知道具体的文件格式。PHPExcel提供了工厂类PHPExcel_IOFactory简化reader和writer的创建。读写文件的示例代码如下:
// 读取文件,自动探测文件格式 $excel = PHPExcel_IOFactory::load("./foo.xlsx"); // 新建excel文件,保存为Excel 2007格式 $excel2 = new PHPExcel(); $writer = PHPExcel_IOFactory::createWriter($excel2, "Excel2007"); $writer->save("./foo2.xlsx");
如果知道具体格式,可以使用具体的类操作:
// 读文件 $reader = PHPExcel_Reader_Excel2007(); $excel = $reader->load("./foo1.xlsx"); // 写文件 $writer = PHPExcel_Writer_Excel2007($excel); $writer->save("./foo2.xlsx");
可用的reader和writer类可以参考下图:
建议使用工厂方法读取文件,它能自动探测文件格式并加载。这在读取用户上传不同格式的文件时很有用,避免了格式与后缀名不符可能导致的错误。
注意不要混淆PHPExcel和writer/reader对象:PHPExcel持有数据,writer和reader是对其进行序列化和反序列化的辅助类。
表单操作
一个excel文件可以包含多个表单,常用操作包括读取、新建、复制和删除表单。表单从属于excel文件,一般需要挂载到具体的PHPExcel对象上。
获取表单的方式有多种,如获取当前表单、获取指定顺序表单、根据名字获取表单。以下是示例代码:
$sheet = $excel->getActiveSheet(); // 获取第二个表单,编号从0开始 $sheet = $excel->getSheet(1); $sheet = $excel->getSheetByName("Worksheet 1");
创建表单分为直接excel文件对象直接创建,也可以先创建表单实例,后续再关联。对应方法为:
$excel->createSheet(); $sheet = new PHPExcel_Worksheet($excel, "sheet 1"); // 一些其他操作 // 作为第二个表单插入到文档中 $excel->addSheet($sheet, 1);
PHPExcel也支持复制表单(包括复制其他PHPExcel对象中的表单):
// 复制表单 $sheet = clone $excel->getSheet(0); $sheet->setTitle("new sheet"); $excel->addSheet($sheet, 1); // $excel->addExternalSheet可以添加其他文件的表单 </pre> 删除表单的API比较简单,只提供了`removeSheetByIndex`一个方法: <pre class="lang:php">// 删除最后一个表单 $index = $excel->getSheetCount() - 1; $excel->removeSheetByIndex($index); // 删除当前表单 $index = $excel->getIndex($excel->getActiveSheet()); $excel->removeSheetByIndex($index);
单元操作
单元是承载内容的主体,其上操作比较复杂,大部分的类和API都与单元相关。单元隶属于具体的表单,使用上和表单类互动最多。
常用操作的包括定位、取值/赋值、格式化等。下面是一些代码示例:
// 获取单元对象 $cell = $sheet->getCell("B1"); $cell = $sheet->getCellByColumnAndRow(1, 1); // 取值 $value = $cell->getValue(); $value = $cell->getCalculatedValue(); // 获取计算后的值 $style = $cell->getStyle(); // 获取格式化对象 $isMerged = $cell->isMergeRangeValueCell(); //是否是合并单元的主单元(合并单元的左上角单元) // 设置值 $sheet->setCellValue("B1", "TEST"); $sheet->setCellValueByColumnAndRow(1, 1, "TEST"); // 批量赋值 $data = [ [2009, 2010, 2011, 2012], ['Q1', 12, 15, 21], ['Q2', 56, 73, 86], ['Q3', 52, 61, 69], ['Q4', 30, 32, 0], ]; $sheet->fromArray($data); $cell->setValue("foo"); // 显示赋值 $cell->setValueExplicit("123456788900", PHPExcel_Cell_DataType::TYPE_STRING); // 合并单元 $sheet->mergeCells('A18:E22'); // 设置格式 // 设置字体为红色 $cell->getStyle()->getFont()->getColor()->setARGB(PHPExcel_Style_Color::COLOR_RED); // 设置边框 $cell->getStyle()->getBorders()->getTop()->setBorderStyle(PHPExcel_Style_Border::BORDER_THICK);
文件属性
设置excel文件的属性,包括常见的作者、标题、创建时间、描述等。该功能由PHPExcel中类型为DocumentProperties的成员变量负责:
$property = $excel->getProperties(); $property->setCreator("tlanyan"); $property->setTitle("demo workbook"); $property->setKeywords("tlanyan, PHPExcel");
其他
上述介绍了常见的概念和操作,实际中可能会用到的概念还包括:
- 缓存和性能
- 图像、图表、超链接等富文本
- 日期、货币等格式化和本地化
- 公式设置
- 打印属性设置
- 内容对其、边距设置等
- 文件密码安全设置
这些冷门或高级功能可以参照API文档。
PHPExcel官方文档可能稍有繁杂,网络上的二手资料在深入方面常有欠缺。要用好PHPExcel,一个基本功是搞清楚操作的对象,以及和其他类/对象的关系(这也是面向对象编程的基本功)。本文中提到的PHPExcel->PHPExcel_WorkSheet->PHPExcel_Cell继承体系,是使用过程中操作最为频繁的对象,希望以上说明和示例能加深读者对PHPExcel类库的理解。