文章起源 | 恒源云

原文地址 | 迁徙


明天来和大家聊一聊,何为迁徙,如何迁徙!

一、何为迁徙?

当实例关机后GPU被占,无奈启动,或者训练过程中想换一台机器显卡,即可关机后进行实例迁徙。迁徙胜利后即可从新开始训练!

二、如何迁徙?

实例迁徙注意事项

  1. 实例迁徙过程不会迁徙实例中的/hy-tmp/目录,并且会革除实例中/hy-tmp/目录下的数据,如果您须要迁徙,则须要把实例中的/hy-tmp/目录中的数据通过OSS命令工具上传至集体数据空间。
  2. 实例迁徙必须先将实例进行关机操作。
  3. 如果应用了/hy-nas目录,则在迁徙时也须要抉择具备 “共享存储”的实例。
  4. 实例迁徙过程中不免费。

实例迁徙步骤

  1. 备份实例中/hy-tmp/目录中的数据,而后通过OSS命令工具上传至集体数据空间。
  2. 通过恒源云控制台关机实例。
  3. 点击实例治理进行迁徙。
  4. 迁徙实现后进入实例,通过OSS命令工具将备份的数据下载到实例/hy-tmp/中。

实例迁徙过程演示

1.备份实例中/hy-tmp/目录中的数据,而后通过OSS命令工具上传至集体数据空间

#查看/hy-tmp目录中的数据,我这里有5个文件和5个目录root@I87f7d582c00801bcf:~# cd /hy-tmp/root@I87f7d582c00801bcf:/hy-tmp# lsdataset1  dataset2  dataset3  dataset4  dataset5  datasetDir1  datasetDir2  datasetDir3  datasetDir4  datasetDir5#将/hy-tmp目录中的数据打包压缩root@I87f7d582c00801bcf:/hy-tmp# tar zpcf dataset.tar.gz ./*#通过OSS命令将打包好的数据上传至集体数据空间root@I87f7d582c00801bcf:/hy-tmp# oss loginUsername:139xxxxxxxxPassword:**********139xxxxxxxx login successfully!root@I87f7d582c00801bcf:/hy-tmp# oss cp dataset.tar.gz oss://#而后查看集体数据空间是否上传胜利root@I87f7d582c00801bcf:/hy-tmp# oss ls -s -d oss://Listing objects .Object list:oss://dataset.tar.gz            #这里为刚上传的数据文件File number is: 1

2.通过恒源云控制台关机实例

3.点击开始迁徙实例

迁徙的指标实例倡议与以后实例的GPU型号雷同

提醒/hy-tmp/目录被革除,如果您没有备份数据,应先去备份数据,而后进行迁徙。

4.进入实例通过OSS命令工具下载数据到以后实例/hy-tmp/目录中

#进入/hy-tmp/目录,而后登录OSSroot@I87f7d582c00801bcf:~# cd /hy-tmp/t@I87f7d582c00801bcf:/hy-tmp# oss loginUsername:139xxxxxxxxPassword:**********139xxxxxxxx login successfully!#查看OSS集体数据空间root@I87f7d582c00801bcf:/hy-tmp# oss ls -s -d oss://Listing objects .Object list:oss://dataset.tar.gzFile number is: 1#下载集体数据空间中的dataset.tar.gz到实例中的当前目录root@I87f7d582c00801bcf:/hy-tmp# oss cp oss://dataset.tar.gz ./#查看下载的数据root@I87f7d582c00801bcf:/hy-tmp# lsdataset.tar.gz#解压数据到当前目录root@I87f7d582c00801bcf:/hy-tmp# tar zxvf dataset.tar.gz#查看解压后的数据文件root@I87f7d582c00801bcf:/hy-tmp# lsdataset1  dataset2  dataset3  dataset4  dataset5  datasetDir1  datasetDir2  datasetDir3  datasetDir4  datasetDir5  dataset.tar.gz