基础镜像可以是空的吗镜像训练方法

关注 mob64ca13fdd43c

基础镜像可以是空的吗镜像训练方法

转载

mob64ca13fdd43c 2024-07-04 11:37:37

文章标签 基础镜像可以是空的吗运维人工智能 json docker 文章分类 云原生云计算

docker基础教程：https://legacy.gitbook.com/book/yeasy/docker_practice/details，通过这个教程可以了解docker基本概念

docker安装：参见我的另一篇博客：

为什么使用docker？

避免复杂的环境的配置，比如cuda。具体环境配置有多复杂参考：本机安装gpu版本的tf安装参见我的另一篇博客：.

而在ubuntu上运行docker tensorflow-gpu镜像，仅仅需要安装nvidia驱动即可，幸运的是一般通过软件更新器（software & updates→ Additional Drivers）即可顺利安装显卡驱动。（docker是多神奇的技术！！！特别值得研究，通过后面的实验发现：单机情况下（博主笔记本配置：i7 7700 + 16G内存 + 4G独显GTX 1050），在容器内训练cifar10模型与本机训练cifar10模型性能几乎相同，由此可见docker是多么牛B的技术）

1.下载镜像

docker tensorflow的镜像官网为https://hub.docker.com/r/tensorflow/tensorflow/，首先按照官方教程安装nvidia-docker2，之后的tensorflow-gpu镜像都需要nvidia-docker来启动，或者docker run --runtime=nvidia，当然这样就足够用了，如果你想用docker取代nvidia-docker可以修改/etc/docker/daemon.json为如下所示，即在第一行加入"default-runtime": "nvidia",这样就可以直接用docker取代nvidia-docker了。

{ "default-runtime": "nvidia", "runtimes": { "nvidia": { "path": "/usr/bin/nvidia-container-runtime", "runtimeArgs": [] } } }

安装配置成功之后选择Tags标签可以看到不同tag的tensorflow镜像，官方实例代码选择的tag为latest-gpu的镜像，可以根据自己的需要下载镜像，博主选择的是1.8.0-devel-gpu-py3的镜像，这个镜像包含tensorflow-gpu=1.8.0版本，并且包含bazel等开发环境可以编译tensorflow的源代码。即此镜像既可以用于训练模型，又可以用来学习tensorflow源码。执行：

docker pull tensorflow/tensorflow:1.8.0-devel-gpu-py3

下载成功后执行：

docker images

可以查看下载的镜像，如下图所示：

基础镜像可以是空的吗镜像训练方法_基础镜像可以是空的吗

可以看到有一个TAG名为1.8.0-devel-gpu-py3的镜像，证明下载成功。

2.启动容器

如果在前面配置了"default-runtime": "nvidia"，那么执行：

docker run --rm -it -v /home/zzh/:/root/tensorflow --name zzh tensorflow/tensorflow:1.8.0-devel-gpu-py3

没有配置则可以执行：

nvidia-docker run --rm -it -v /home/zzh/:/root/tensorflow --name zzh tensorflow/tensorflow:1.8.0-devel-gpu-py3

或者执行：

docker run --runtime=nvidia --rm -it -v /home/zzh/:/root/tensorflow --name zzh tensorflow/tensorflow:1.8.0-devel-gpu-py3

其中docker run的参数含义如下：

（1）--rm 退出容器清除数据

（2）-it 启动交互式终端

（3）-v 挂在目录

（4）--name 容器名称

具体细节参考官方文档：https://docs.docker.com/engine/reference/run/

3.在容器中训练cifar10

cifar10教程：https://www.tensorflow.org/tutorials/deep_cnn

在本机某一路径下创建好项目，执行脚本后可以看到训练的速度，如下图所示：

基础镜像可以是空的吗镜像训练方法_docker_02

可以看到，step 0到200的时间是13.52秒。

将这个目录挂在到容器中，在容器中训练，速度如下图所示：

基础镜像可以是空的吗镜像训练方法_人工智能_03

可以看到，step 0到200的时间是12.39秒（快了的原因是容器中的是tensorflow1.8，而本机由于驱动版本的原因只能安装tensorflow1.4）

可以看到性能基本是无损的，并且由于本机显卡驱动版本低不能安装高版本的tf问题也能通过docker解决。看看，docker是不是屌炸天，性能居然基本无损，真的值得研究研究！！！

4.其他docker使用技巧

（1）通过[docker commit CONTAINER_ID newImageName]保存对镜像的修改，CONTAINER_ID可以通过docker ps查看

（2）通过[docker save -o 文件名镜像名] 将镜像存储至磁盘，例如docker save -o tensorflow.tar tensorflow/tensorflow:1.8.0-devel-gpu-py3

（3）通过[docker load --input 文件名] 从磁盘导入镜像，例如docker load --input tensorflow.tar

（4）容器一旦退出里面的信息就都会被清除，若不想保存修改又不想丢失信息，那么可以CTRL+P+Q让容器在后台运行，然后通过docker attach CONTAINER_ID重新连接进容器

5.起飞吧！！！

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：视图怎么由mysql转为pgsql mysql视图转表

下一篇：docker push时定义image名称 docker push tag

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册