文章起源 | 恒源云社区

原文地址 | 【小技巧-工具篇】


1、JupyterLab/TensorBoard 如何应用?

可参考JupyterLab文档、TensorBoard文档。

2、JupyterLab打不开或者响应慢怎么办?

如果遇到JupyterLab页面响应特地迟缓或者打不开的状况,可登录实例后通过以下命令来重启JupyterLab

supervisorctl restart jupyterlab

不倡议通过JupyterLab页面间接运行较耗费资源的程序,因为该程序很可能会导致JupyterLab无响应或者运行迟缓问题,可通过tmux工具搁置在实例后盾运行。

3、tensorboard打不开或者响应慢怎么办?

如果遇到tensorboard页面响应特地迟缓或者打不开的状况,可登录实例后通过以下命令来重启tensorboard

supervisorctl restart tensorboard

4、自定义镜像如何装置jupyterlab?

自定义镜像登录实例后,执行如下命令,即可实现装置jupyterlab,装置实现后,可通过控制台关上jupyterlab页面

curl -OL "https://download.gpushare.com/download/custom_install"chmod u+x ./custom_install./custom_install jupyterlab

5、自定义镜像如何装置tensorboard?

自定义镜像登录实例后,执行如下命令,即可实现装置tensorboard,装置实现后,可通过控制台关上tensorboard页面

curl -OL "https://download.gpushare.com/download/custom_install"chmod u+x ./custom_install./custom_install tensorboard

6、JupyterLab 要输出明码怎么办?

通过终端执行 jupyter server list 命令能够失去 JupyterLab 的登陆 Token。

如下能够从执行后果内取得 Token 为 3fq593blw4afqjtqgdp3ldk5。

root@I15b96311d0280127d:~# jupyter server listCurrently running servers:http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /

7、TensorFlow 训练报 ptxas fatal 谬误

当在 RTX 3000 系列显卡上应用 TensorFlow 2.4 For CUDA 11.0 时,训练会呈现下列正告。

W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'

起因是该版本的 PTX compiler 不反对 8.6 compute capability。此报错为正告,不影响失常训练。

该正告能够通过 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 敞开。

此问题尽管不影响训练但性能上会升高,举荐创立 TensorFlow 2.5 For CUDA 11.2 的镜像,不会存在此问题。