跑个20G的模型,都是家常便饭
以前8G显卡 只能跑个6G的模型,再大就用内存了,速度就和核显没区别了。
同求教程。
不过我试P106-100 6G显卡+48G内存也可以跑32B啊,只是很慢
杜甫 发表于 2025-4-12 13:55
同求教程。
不过我试P106-100 6G显卡+48G内存也可以跑32B啊,只是很慢
本帖最后由 吊打华伪 于 2025-4-12 14:36 编辑
shc 发表于 2025-4-12 13:57
楼主是只有核显,还是有独显再开核显?
吊打华伪 发表于 2025-4-12 14:28
你比我还慢。。。准确的说慢多了。
pcie, 你矿卡才1.1*16,你理论值才4GB/s 比我慢多了。双通道内存带宽 ...
杜甫 发表于 2025-4-12 14:43
刚试了下,
跑deepseek-coder-v2 16B 这个模型
速度有9token/秒,不知道把P106拔下来后有多少