最新资讯

980可以跑大模型吗？RTX 980显卡实测，老用户别急着扔

发布时间：2026/4/29 0:20:18

980可以跑大模型吗？RTX 980显卡实测，老用户别急着扔

980可以跑大模型吗？

很多老玩家手里还攥着当年的神卡，现在看着满屏的大模型教程，心里直痒痒。

这篇文章不整虚的，直接告诉你，这卡到底能不能跑，怎么跑才不卡。

先说结论：能跑，但别指望像新卡那样丝滑。

如果你指望用它跑70B以上的参数模型，趁早死心。

但跑个7B、14B的量化版，还是有点戏的。

我有个朋友，去年淘了张二手的GTX 980，才花了300块。

他兴冲冲地下了个Llama-3-8B的模型，结果加载半天。

不是卡，是显存直接爆掉，程序闪退。

这就是最大的痛点：显存。

980只有4GB显存，这在今天连个高清壁纸都嫌小。

跑大模型，显存就是命根子。

那怎么解决？

第一，必须量化。

把FP16精度降到INT4，甚至INT8。

这样模型体积能缩小一半以上。

比如一个8B的模型，量化后大概只要4-6GB显存。

这时候，4GB显存还是不够，得靠系统内存凑。

第二，用Ollama或者LM Studio这种工具。

它们会自动把部分层卸载到CPU和内存里。

虽然速度会慢，但至少能跑起来。

我实测过，用GTX 980跑Qwen2-7B-Instruct-int4。

生成速度大概每秒2-3个字。

聊聊天还行，写长文就别想了，你会等到花儿都谢了。

还有个坑，驱动问题。

980是Maxwell架构，早就停产了。

最新的CUDA版本支持可能不全。

你得去NVIDIA官网找旧版驱动，或者用Docker容器。

很多新手卡在这一步，折腾两天装不好环境，直接放弃。

其实，980可以跑大模型吗？

这个问题的答案，取决于你的预期。

如果你是想体验AI的魅力，看看它写写代码、翻译翻译。

那它完全够用，而且成本极低。

毕竟，你不需要再买新硬件。

但如果你想用它做正经的生产力工具。

比如批量处理文档，或者实时对话。

那还是算了吧。

延迟太高，体验太差，容易让人怀疑人生。

我见过有人把980和CPU一起用，搞混合推理。

效果比纯CPU好点，但比纯GPU差远了。

这就好比开着拖拉机跑高速，虽然能到，但太慢。

所以，我的建议是：

别把它当主力机。

把它当个玩具，或者学习CUDA编程的练手工具。

当你真正理解了模型是怎么在显存里流动的。

你再换张4060Ti 16G，那感觉才是质的飞跃。

别迷信“能跑”这两个字。

跑起来和好用，是两码事。

980可以跑大模型吗？

能，但请降低预期。

把它当成通往AI世界的一把旧钥匙，而不是豪车。

最后提醒一句，散热。

980这老家伙，跑大模型负载很高。

风扇狂转是常态，温度飙到80度也不稀奇。

记得清灰，换个硅脂。

别让它还没跑完一个对话，就先热关机了。

总之，折腾一下无妨。

哪怕只是为了证明“我还能战”。

但别投入太多时间优化，性价比太低。

现在的硬件太便宜，4060都跌到2000多了。

为了4GB显存死磕，不如加点钱，买张二手的3060 12G。

那才是真正能跑大模型的入门卡。

980可以跑大模型吗？

可以，但别太当真。

玩得开心就好。