multiprocessing传递自定义的类 multiprocessing map

关注 colddawn

multiprocessing传递自定义的类 multiprocessing map

转载

colddawn 2024-04-23 15:17:52

文章标签 deep learning ubuntu 共享内存多进程 python 文章分类 架构后端开发

在MindSpore的数据集加载接口中，可以启动多进程模式加快数据处理速度，具体有2个API支持：

mindspore.dataset.GeneratorDataset

mindspore.dataset.GeneratorDataset(source, column_names=None, column_types=None, schema=None, num_samples=None, num_parallel_workers=1, shuffle=None, sampler=None, num_shards=None, shard_id=None, python_multiprocessing=True, max_rowsize=6)

mindspore.dataset.map

map(operations, input_columns=None, output_columns=None, column_order=None, num_parallel_workers=None, python_multiprocessing=False, cache=None, callbacks=None, max_rowsize=16, offload=None)

这两个API中，与多进程启动相关的参数是python_multiprocessing和max_rowsize。

python_multiprocessing决定是否启用多进程模式加快数据处理速度，而max_rowsize用于配置多进程模式下共享内存的大小，属于高级用法。

一般来说，只需要将python_multiprocessing设置为True在大多数情况下就可以适用。

△ 如果打开了多进程模式，可能会碰到以下的错误，这里总结了一些常见的错误和解决办法。

错误1：

multiprocessing传递自定义的类 multiprocessing map_共享内存

核心报错信息是 This might be caused by insufficient shm, and the recommended shm size is at least 5 GB.

原因：

系统可用的共享内存太小，可以通过 df -h 查看共享内存的大小，如下示例有500G的共享内存，妥妥的够用啦。

multiprocessing传递自定义的类 multiprocessing map_共享内存_02

解决办法：

如果发现自身系统的 /dev/shm 不足5G，那确实会导致这个错误，有2个解决办法

关闭多进程模式，即设置python_multiprocessing=False。这样就会采用多线程模式进行加速，同样也会有一定的加速效果，也可以调节num_parallel_workers增加线程/进程数，以提高整体的数据处理效率。
申请更多的共享内存，可以参考博客上教程调整共享内存，如

错误2：

multiprocessing传递自定义的类 multiprocessing map_多进程_03

核心报错信息是 OSError: [Errno 24] Too many open files.

这个错误可能会在非root用户下使用多进程模式时触发

原因：

有几个可能的原因

如上一个错误所属，共享内存不足5G，导致无法使用。
如果发现/dev/shm超过5G，却还是这个错误，则可能是非root用户可用资源的限制，可以通过 ulimit -a 查看非root用户可用资源

multiprocessing传递自定义的类 multiprocessing map_python_04

可以看到当前用户的可用 open files 数目只有2，这样很大程度就会抛出上述错误。

解决办法：

通过 ulimit -a 查看 open files 的数量，然后通过 ulimit -n 设置成较大的数值，如

multiprocessing传递自定义的类 multiprocessing map_ubuntu_05

重新启动训练就可以啦。

错误3：

multiprocessing传递自定义的类 multiprocessing map_共享内存_06

核心报错信息是 Insufficient shared memory available. Required: xxxxx, Available: xxxxx.

这个错误可能会在共享内存不够/处理的数据块过大时触发

原因：

可能有其他进程也在使用共享内存，使用 df -h 查看 /dev/shm 当前的可用大小
当前正在处理的数据非常大，导致其占用了过多的共享内存，使得共享内存不够用了

解决办法：

在允许的范围内，尽可能增大共享内存的大小，如
检查数据处理时，是否正在处理过大的数据导致内存占用太多
通过 mindspore.dataset.config.set_prefetch_size() 减少数据管道中缓存的数据量
实在不行，通过 mindspore.dataset.config.set_enable_shared_mem(False) 关掉共享内存

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：python获取微信deviceId python获取微信窗口

下一篇：push后没有create merge request push update

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册