在数据盘里新建家目录和用户

理由：数据盘读写数据快，装环境也快。所以想把Anaconda直接装进数据盘中。

创建新用户

以恒源云为例，别的云服务器找到对应的数据盘位置进行同样的操作就好，替换用户名为你自己想起的。

1 2	mkdir /hy-tmp/home sudo useradd -d /hy-tmp/home/lyc -m -s /bin/bash lyc

第一行代码是为了在数据盘下的文件夹创建一个名为/home的文件夹

第二行代码中，/hy-tmp/home/lyc 是新用户的主目录路径，lyc 是新用户的用户名。

接着为新用户设密码

1	sudo passwd lyc

##为新用户赋予管理员权限
在root身份下，使用以下命令将新用户添加到 sudo 用户组

1	sudo usermod -aG sudo lyc

我会再进行一道操作：执行以下命令打开sudoers文件：

visudo

在文件中以下位置添加以下行：

1 2	# User privilege specification lyc ALL=(ALL:ALL) ALL

这里需要一些linux的vim基础知识。按i，进入编辑模式，编辑后按 :wq 保存并退出。注意英文字符。现在用户lyc就具有管理员权限了。

验证管理员权限是否赋予成功

1	groups lyc

输出中应该包含 sudo 组。有就成功了。成功之后你就可以使用自己创建的用户和密码登录你的服务器。

补充一些Linux常用命令

(1) ctrl c: 取消命令，并且换行
(2) ctrl u: 清空本行命令
(3) tab键：可以补全命令和文件名，如果补全不了快速按两下tab键，可以显示备选选项
(4) ls: 列出当前目录下所有文件，蓝色的是文件夹，白色的是普通文件，绿色的是可执行文件
(5) pwd: 显示当前路径
(6) cd XXX: 进入XXX目录下, cd .. 返回上层目录
(7) cp XXX YYY: 将XXX文件复制成YYY，XXX和YYY可以是一个路径，比如../dir_c/a.txt，表示上
层目录下的dir_c文件夹下的文件a.txt
(8) mkdir XXX: 创建目录XXX
(9) rm XXX: 删除普通文件; rm XXX -r: 删除文件夹
(10) mv XXX YYY: 将XXX文件移动到YYY，和cp命令一样，XXX和YYY可以是一个路径；重命名也是用
这个命令
(11) touch XXX: 创建一个文件
(12) cat XXX: 展示文件XXX中的内容
(13) 复制文本
 windows/Linux下：Ctrl + insert，Mac下：command + c
(14) 粘贴文本
 windows/Linux下：Shift + insert，Mac下：command + v
(15)top：查看进程
(16)watch -n 0.1 nvidia-smi: 实时查看显存占用情况
(17)kill -9 21121:杀死PID为21121的进程
(18)nohup python3 main.py & ：后台运行代码

登录后可能遇到的问题

接下来的操作建议使用自己新创建好的用户登录后操作

如果遇到文件夹cd不让访问，就给文件夹增加读写权限：

1	sudo chmod -R 755 /path/to/folder

chmod 命令更改目标文件夹的权限为 755，其中 7 表示用户拥有读、写和执行权限，5 表示组和其他用户拥有读和执行权限。

如果遇到权限问题 Permission denied，就在命令的前面加sudo，如

1	sudo chmod 755 /root/

Nvidia显驱安装

租的服务器一般都装好显驱了，如果你执行

1	nvidia-smi

有输出，你就可以跳过这一部分，否则的话，参照：Ubuntu安装显卡驱动详细步骤_apt install nvidia-driver-415_李老板Holden的博客-CSDN博客

Anaconda安装

这里可以参照https://blog.csdn.net/m0_62033123/article/details/126673745

简单来说，先去自己的用户目录下：

1	cd: /hy-tmp/home/lyc

第一步使用wget下载：

1	wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh

下载之后,在对应目录使用如下命令安装

1	bash Anaconda3-2022.05-Linux-x86_64.sh

安装过程就是一路回车一路yes。

提示安装成功后，会有个Anaconda文件夹，用自己的用户重登一下服务器或者执行：

1	source .bash

应该就能看到你的命令行前面多了（bash）了。这意味着你跑的代码将会在bash环境下的python执行。

Pytorch安装

如果你只是用pytorch跑代码，不使用tensorflow。可以不安装cuda，直接安装pytorch。这是因为安装pytorch的同时会安装cudatoolkit

使用conda创建自己的虚拟环境

虚拟环境一般和项目名有关：

1 2	conda create -n xray python=3.7 conda activate xray

现在应该从base环境进入到你新建的环境中了。

在自己的虚拟环境中安装pytorch

这里内容可以参照：https://blog.csdn.net/gg864461719/article/details/112259806

在这里找到对应版本，并使用镜像下载。

以Pytorch1.7为例：

1 2	conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

注意，30系显卡CUDA只能选择11.0以上的版本

安装依赖包

激活自己的环境后，可以在自己的环境下安装对应的依赖包。

命令格式：

1
2
3

pip3 install keras==2.3.1（推荐pip3,貌似快一点）
或
conda install numpy

运行

通过云服务器推荐的方式上传自己的项目后，推荐使用命令行执行代码

先激活自己的环境，找到自己要运行的代码。cd进去。就可以先直接运行检查代码能否正常运行：

1	python train.py

如果确认过代码所需依赖都安装了，并且没bug，推荐后台运行：

1	nohup python -u train.py > XXX.log 2>&1 &

代码执行的信息会保存到XXX.log文件中。