使用php自带的ZipArchive来解压带中文文件名压缩包时会造成乱码,现象如下:

原结构:

 解决php使用ZipArchive解压时中文乱码问题_文件名

解压代码:

$zip = new \ZipArchive();
$res = $zip->open('./钱学森班.zip');
if ($res !== true){
throw new \Exception('打开压缩包失败');
}
$zip->extractTo('./cache');
$zip->close();


 解压后:

 解决php使用ZipArchive解压时中文乱码问题_压缩包_02

原因

默认windows,mac打压缩包时编码为简体中文,解压时未作文件转化导致解压结果与预期不符

解决方法

打开压缩包后先将内部文件名及目录进行转码,转码后需关闭压缩包并重新打开解压

实现如下:

$zipName = './钱学森班.zip';
$zip = new \ZipArchive();
$res = $zip->open($zipName);
if ($res !== true){
throw new \Exception('打开压缩包失败');
}

// 加入此段↓
$fileNum = $zip->numFiles;
for ($i = 0; $i < $fileNum; $i++) {
$statInfo = $zip->statIndex($i, ZipArchive::FL_ENC_RAW);
$zip->renameIndex($i, iconv('GBK', 'utf-8//IGNORE', $statInfo['name']));
}
$zip->close();
$zip->open($zipName);
// 截至↑

$zip->extractTo($extractTo);
$zip->close();



注意事项

  • 转码后因为修改了原压缩包文件,所以​不可重复转码​,若不想对原文件产生影响需先​复制​(php-zip扩展是自己读文件流,不需要复制)
  • 转换前使用mb_detect_encoding进行编码判断依然是返回UTF-8