客服

保存环境功能说明

如何使用矩池云的保存环境功能

0. 环境使用注意事项

  1. 保存的环境文件.snap将占用网盘空间;删除环境后,网盘内文件将同步删除
  2. 运行中的环境不建议删除;删除后,将无法成功保存新的环境

1. 为什么要保存环境?

目前,矩池云的所有机器都支持保存当前环境的功能(包含机器中除网盘以外的所有文件变动)。
租用机器的时候,我们可以选择矩池云为大家提供的基础镜像,在进行项目运行、调试的时候,大家可能会在基础镜像上进行修改,比如安装第三方python包、自己conda创建了新的虚拟环境、apt安装了其他系统工具等,默认释放机器时会直接清除所有机器环境。
如果你想保存这些修改,你可以选择保存环境,保存成功后,下次租用机器时可直接从该环境中恢复。保存的环境将以 .snap 文件的格式保存在您的网盘中,在保存环境前请确保网盘空间足够,避免保存失败。
请不要直接从我的网盘中删除这些文件以免发生异常,如果不需要可以在我的环境中删除。

2. 如何保存环境?

在机器租用界面,点击右侧 [更多] - [保存环境] 按钮。
点击保存
点击后,会弹出保存环境的窗口。
保存环境时需要输入名称,名称必填。如果想在保存成功后直接释放机器,可以打上勾。但如果保存失败了,机器不会自动释放。
填写镜像名称
注意
  1. 确保网盘空间足够,否则可能会保存失败。保存成功会在网盘里面生成“.snap”文件。删除“.snap”文件,会导致镜像恢复失败。
  2. 保存中机器不可用,请在保存前确定没有运行中的进程。
点击保存环境按钮后,会开始保存当前环境。
保存中
保存过程中,您可以点击取消保存,取消保存后机器会自动恢复运行。
取消保存
如果您在保存前没有选择保存成功后自动释放机器,可在保存途中增加此配置。注意,只能增加此配置,若之前已经配置了保存成功后自动释放机器,则不能取消。
保存成功自动释放机器
选上该配置
保存完毕后,如果您没有选择自动释放或者保存失败了,机器会自动恢复运行,并且会收到短信提醒。
恢复中

3. 保存的环境太大怎么优化?

保存的环境包含机器中除网盘(/mnt 目录)以外的所有文件变动,一般优化方法是在保存环境前,将数据代码文件移动到网盘中(/mnt 目录)。
  • 节约网盘空间,先压缩数据代码文件夹,然后存入 /mnt 网盘目录中
bash
# 以 home 目录下的 mydata 文件夹为例
# 执行下面压缩命令,压缩 /home/mydata 文件夹中内容到网盘 /mnt 目录的 mydata.zip 中
zip -r /mnt/mydata.zip /home/mydata
# 删除机器/home/mydata中文件
rm -rf /home/mydata
注意:
  1. rm -rf指令后一定要输入对应要删除的文件夹路径,如:/home/mydata;
  2. 如果你使用的数据集/预训练模型已经存在矩池云公开数据集&预训练模型中,你可以在租用机器的时候直接从对应目录复制到指定目录使用即可,无需保存的网盘或者环境中。
  • 直接移动文件夹,避免下次还需解压
bash
# 直接将 /home 中的 mydata 文件夹移动到 /mnt 中
mv /home/mydata /mnt/
数据备份提示:需要备份矩池云服务器中的数据也可以使用本方法,在机器中,将文件移动到网盘目录 /mnt 后,可以直接在矩池云网盘中下载到本地。

4. 从保存的环境启动机器

保存成功后,下次租用其他机器也可以从该环境中启动。
租用机器时,选择我的环境,选择你要恢复的环境。
my_snapshot
下单租用即可。
如果租用机器的时候发现自己保存的环境无法选择,可以将鼠标箭头移动到!(感叹号)图标上,会有相关说明,常见问题:
  • CUDA 版本不匹配:选择环境的 CUDA 版本和当前选择主机支持的 CUDA 版本不匹配,可以换一台机器看看,例如 NVIDIA A系列显卡(A30、A4000等)只支持 CUDA11 及以上版本。
  • 该环境与主机不匹配:目前有Windows主机、虚拟机主机、普通Linux主机,请选择对应主机启动保存的环境,比如在 Windows主机 下保存的环境,只能租用 Windows主机 启动。
select_error
更多问题,可以联系矩池云小助手

5. 管理保存的环境

进入 [个人中心] - [我的租用] - [我的环境] 中,可以查看到之前保存的所有环境。
我的环境
您可以在这里重命名、删除您的环境。
注意:若某环境的状态是"运行中",说明有机器正在使用该环境,如果强制删除,会导致该机器无法继续保存环境。
例如,您从保存的“测试环境”中启动机器,对机器环境修改后想保存为“正式环境”。但由于您删除了“测试环境”的文件,修改后的环境也将无法保存。您可以在“正式环境”保存成功后,再删除“测试环境”。