Tesla P40计算卡在WDDM模式关机导致服务器无法进入系统的解决办法

前段时间家里意外停电了,导致正在运行的Dell R730服务器关机,来电开机时发现无法进入系统,卡在windows启动界面,而当时我无法及时本地操作,于是使用了iDrac进行远程调整。

发现故障

当时是想访问部署在服务器上的SD WebUI,发现无法连接,然后想远程桌面连接看看发生了什么,结果远程也连接不上,此时我选择去连接另一台物理保障的计算机(以下简称服务器B),发现也连不上。于是打电话回家(我在外地上大学),我妈说服务器(R730)没在运行状态,我让她开机,但是一直等了20分钟也没进系统,也顺便查看了服务器B,发现它也是开着的,但是无法远程。猜测是DDNS没有及时转发动态公网的问题,让我妈查看了家里的IP,终于连上了服务器B,也终于能访问R730的iDrac界面了。

发现了断电的日志

接下来就是

解决故障

因为之前出现过类似的故障,但当时是我手动把P40拆下来,再在系统里改回TCC模式解决的问题,这次人在外地,就不能这么做了,所以以下是完全远程的解决方案。

启动服务器的虚拟控制台,需要JAVA环境。

让机器重启,进入BIOS

进入BIOS后按照如下的操作进入PCIE插槽管理页面。

根据DELL官方的说明文档,得知Slot4、6是x16的接口,就是我们连接计算卡的接口,我们把它们禁用。

当然,如果知道自己的卡插在哪个Slot上就只禁用那个Slot。

最后一步一步退出,记得保存。

接下来机器会重启进入系统,如果此时还是进不去系统,那就不是WDDM模式的问题了。

进入系统后就开始重新调整注册表参数,使用WIN+R,输入“regedit”打开编辑器。

位置在:计算机\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class\{4d36e968-e325-11ce-bfc1-08002be10318}\目录下

找到P40的那个文件夹,一般看右边的设备信息

在此目录下

创建DWORD,名称“AdapterType”,参数为2,16进制。

修改“FeatureScore”参数从“d1”改为“cf”。

删除“GridLicensedFeatures

删除“EnableMsHybrid

在默认输出显卡(0000)目录下

删除“EnableMsHybrid

关机,重启进入BIOS,按照前面的教程重新开启那两个禁用掉的Slot。

重启,运行nvidia-smi,如果报错就重新安装一遍驱动,可以看到显卡运行在了TCC模式。

总结

我猜测可能在WDDM模式下,系统的默认显示输出设备出现了错误,导致无法正常进入系统。

我也把这篇文章发在了CSDN上,略作修改。

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇