网站设计制作费,淘宝运营培训课程免费,宁波厂家关键词优化,网站上传文件不存在文章目录 一、待解决问题1.1 问题描述1.2 解决方法 二、方法详述2.1 必要说明2.2 应用步骤2.2.1 更改镜像源2.2.2 安装NVIDIA显卡驱动#xff1a;nvidia-550#xff08;1#xff09;查询显卡ID#xff08;2#xff09;PCI ID Repository查询显卡型号#xff08;3#xf… 文章目录 一、待解决问题1.1 问题描述1.2 解决方法 二、方法详述2.1 必要说明2.2 应用步骤2.2.1 更改镜像源2.2.2 安装NVIDIA显卡驱动nvidia-5501查询显卡ID2PCI ID Repository查询显卡型号3安装显卡驱动4检测驱动安装是否成功 2.2.3 安装NVIDIA显卡计算平台CUDA 12.41查看可安装CUDA最高版本2查看设备安装的操作系统版本、linux内核版本、硬件架构3安装CUDA 12.44检测CUDA安装是否成功 三、疑问3.1 显卡驱动安装好后CUDA安装报错。3.2 显卡驱动安装时报错“build kernel module error ” 四、总结 一、待解决问题
1.1 问题描述
新装了ubuntu 22.04 LTS 系统后除了系统自带的基础软件外都是空白。 为了运行MARL算法安装其必要的基础运行环境。
1.2 解决方法
1更改镜像源 2安装NVIDIA显卡驱动nvidia-550 3安装NVIDIA显卡计算平台CUDA 12.4
二、方法详述
2.1 必要说明
暂无
2.2 应用步骤
2.2.1 更改镜像源
1登录清华镜像源网站并基于ubuntu版本复制内容。 链接清华大学开源软件镜像站 2进入sourcelist文件路径备份原文件并更改镜像源
cd /etc/apt/
sudo cp -i sources.list sources-backup.list
ls
sudo gedit sources.list将镜像链接内容复制并保存 3应用镜像源
sudo apt update2.2.2 安装NVIDIA显卡驱动nvidia-550
1查询显卡ID
lspci | grep -i nvidia2PCI ID Repository查询显卡型号
链接PCI ID Repository Nvidia 显卡型号查询 下拉到底部有个搜索框输入显卡ID
3安装显卡驱动
使用ubuntu自带的SoftwareUpdates工具安装
#检测可安装的驱动程序
ubuntu-drivers devices选择推荐的 “nvidia-driver-550” 版本驱动。
在正式开始安装之前先更新一下make、gcc、g。 这里更新gcc-12、g±12的原因是nvidia-550要求最新版本的gcc、g
#查看当前gcc版本果然为11.4
gcc --version
#安装依赖项
sudo apt-get install build-essential
sudo apt-get install make
#安装gcc-12
sudo apt-get install gcc-12
sudo apt install g-12
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 12
sudo update-alternatives --install /usr/bin/g g /usr/bin/g-12 60
g --version
gcc --version安装之前查看是否已有安装nvdia驱动有的话直接删除。
nvidia-smi
#卸载Nvidia驱动及相关组件
sudo apt-get remove --purge ^nvidia-.*
sudo apt-get autoremove
#自动下载安装nvidia-550驱动程序
sudo apt-get install -y cuda-drivers-550安装过程弹出UEFI secure boot阻拦大致意思是 在安装 NVIDIA 显卡驱动时遇到此错误是因为启用了 UEFI 安全启动导致系统无法加载第三方驱动程序。 然后按照提示说 1会生成一个MOK密钥然后需要录入到固件内。 2过程中会设置一个password。 3重启后可选择 “Enroll MOK”录入密钥 或者 “Change Secure Boot”改变安全启动项的选项。 ❓什么是UEFI安全启动呢 说白了其实就是设备的一种安全机制。它通过验证启动组件的数字签名来防止未经授权的软件如恶意软件或未经授权的驱动程序在系统启动时运行。 由于我们是双系统直接关闭Secure Boot可能会存在风险先尝试 “Enroll MOK”的选项。
设置一个password。 程序跑完直接重启
sudo reboot重启后进入“蓝色”界面选择“Enroll MOK” 下一个页面选择 “Continue” 再选择 “Yes” 输入 设置好的Password没有报错的话直接选择 Reboot。 重启
4检测驱动安装是否成功
nvidia-smi看到驱动版本为550.120,并且有对应的可安装的CUDA最高版本为 12.4。 查看软件更新内的驱动使用情况
software-properties-gtk至此nvidia-550显卡驱动安装成功。
2.2.3 安装NVIDIA显卡计算平台CUDA 12.4
1查看可安装CUDA最高版本
nvidia-smi看到驱动版本为550.120,并且有对应的可安装的CUDA最高版本为 12.4。 也可以上官方网站上查看驱动型号下支持的CUDA版本。 链接https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html#cuda-toolkit-major-component-versions 2查看设备安装的操作系统版本、linux内核版本、硬件架构
lsb_release -a
uname -rp3安装CUDA 12.4
前往nvidia官网下载CUDA安装包链接CUDA Toolkit发行版下载 选择对应系统版本和硬件架构。 按照指令安装
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda-repo-ubuntu2204-12-4-local_12.4.1-550.54.15-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-4-local_12.4.1-550.54.15-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-4-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4安装无报错后重启
sudo reboot4检测CUDA安装是否成功
CUDA官方也给出安装和检测教程。 链接https://docs.nvidia.com/cuda/cuda-quick-start-guide/index.html#debian-installer 设置环境变量这里由于安装的是12.4,对应修改一下。 打开编辑 ~/.bashrc 文件。
sudo gedit ~/.bashrc将下面环境变量代码添加至最后一行并点击“保存”。 #cuda12.4 envirionment #cuda12.4 environment export PATH/usr/local/cuda-12.4/binKaTeX parse error: Expected }, got EOF at end of input: {PATH::{PATH}} export LD_LIBRARY_PATH/usr/local/cuda-12.4/lib64${LD_LIBRARY_PATH::${LD_LIBRARY_PATH}} 应用环境变量生效
#让环境变量生效
source ~/.bashrc使用下面代码能够查看CUDA版本即安装成功
nvcc -version
./__nvcc_device_query其中89与我设备GPU型号RTX 4060匹配。 89 代表你的 GPU 架构版本为 8.9。 在 NVIDIA 的 CUDA 开发中GPU 架构通过计算能力Compute Capability来定义通常以 sm_XX 或 compute_XX 的形式表示。 sm_89 表示 GPU 的架构版本为 8.9。这是 NVIDIA 对 Ada Lovelace 架构 的计算能力标识如 RTX 4060 等显卡。 完结撒花
三、疑问
3.1 显卡驱动安装好后CUDA安装报错。
报错信息如下 感觉是显卡驱动存在问题尝试卸载显卡驱动重新下载推荐的驱动版本。
#检测可安装的驱动程序
ubuntu-drivers devices选择推荐的 “nvidia-driver-550” 版本驱动。
#卸载Nvidia驱动及相关组件
sudo apt-get remove --purge ^nvidia-.*
sudo apt-get autoremove
sudo apt install nvidia-driver-5503.2 显卡驱动安装时报错“build kernel module error ”
解决流程 1卸载原先驱动
#查看当前已安装驱动
ubuntu-drivers devices
#卸载Nvidia驱动及相关组件
sudo apt-get remove --purge ^nvidia-.*
sudo apt-get autoremove2前往nvidia官网查找对应驱动 链接https://www.nvidia.cn/drivers/lookup/ 找到对应驱动下载我依然下载535版本的驱动。 开始安装驱动
sudo apt update sudo apt upgrade
sudo chmod 777 NVIDIA-Linux-x86_64-535.183.01.run
sudo ./NVIDIA-Linux-x86_64-535.183.01.run 安装过程中提示需关闭 Nouveau 程序自动创建了一个文件然后重启。重启后继续执行安装文件看到如下报错 去对应文件查找原因发现第一条报错信息如下 cc: error: unrecognized command-line option ‘-ftrivial-auto-var-initzero’ 网上搜索了一下咨询大模型原因如下 该错误通常是由于 GCCGNU Compiler Collection版本不兼容导致的。Nvidia 显卡驱动程序在安装过程中需要编译内核模块而某些较新的内核版本需要更高版本的 GCC 才能正确编译。 开始升级GCC版本
#查看当前gcc版本为11.4
gcc --version
#安装gcc-12
sudo apt-get install gcc-12
sudo apt install g-12
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 12
sudo update-alternatives --install /usr/bin/g g /usr/bin/g-12 60
g --version
gcc --version至此再尝试安装nvidia显卡驱动
四、总结
安装新的软件或系统时注意记录以便分析安装过程最好按照软件的官方教程安装过程遇到错误不要随意搜索仔细分析过程中的报错信息按图索骥