由导出CSV文件格式错误的小结

26次阅读

共计 732 个字符,预计需要花费 2 分钟才能阅读完成。

问题描述:
目前、一般情况下,在 web 开发过程中,使用导入导出报表的情形很多。我们先说导出。项目数据量多导出行数较多,50 万行左右,选择的是 csv 方式导出。针对以下应用场景,导出过程有几点需要注意的的地方。
(测试使用环境、php7.1,mysql5.7.22,mysql5.5.53,mac 自带 numbers 6.0 版本,Windows 系统 Excel2007 版)

应用场景:
1、用户只习惯用 Excel 处理数据,csv 导出但是用 excel 打开。
2、无论导入导出,用户均对数据表格格式没有要求(边框、底纹、对齐等),仅对数据格式有基本要求(数字、文本、浮点数等)。
3、后端对 xls/xlsx 大文件的导入性能较差。(目前 php 导出 excel 方式占用内存较大。大数据导出很可能就是内存溢出)

导出注意点:
1、导出数据庞大,尽可能少用汉字。比如有些状态字段,数据库存的就是数字或只占一个字节,完全换成中文状态的话,可能达 6 个字节甚至更多。效率受影响。若是必须要用中文形式。尽可能精简。

2、其他常见问题。先看一组图:

这是初始要导出的数据

这是 csv 格式展示,这是我们想要的结果。

这是 windows 系统 excel2007 版本打开的样子。
仔细观察,我们发现了几个问题:zifunumebr 字段前导 0 都没了。number 字段有个长整型变成了科学计数法。zifu 字段中文汉字变成了乱码。最后一行 zifu、fudian 字段在 excel 中显示的时候合并了。
这里解决方法其实也很简单。就是在插入字段后面加一个制表符“t”, 注意,不能使用单引号。这样一来除了中文乱码不能解决,其他类型字段都能解决。中文乱码解决的话,其实也很简单,iconv 函数,将 urf- 8 转为 GBK 编码,在 Excel 中打开就不会错了

正文完
 0