找回密码
 注册
快捷导航
12
返回列表 发新帖
楼主: kelvin1946

看什么春晚,起来嘿,干活了

  [复制链接] |自动提醒
阅读字号:
xdni336 - T50-56

1万

回帖

266

积分

10万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2003-3-19
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)金牌荣誉勋章(注册20年以上会员)年全勤勋章2023年全勤勋章2024
发表于 2025-1-31 15:10:46| 字数 175| - 中国–香港 电讯盈科有限公司 来自iOS客户端 | 显示全部楼层
QUOTE:
Nanano 发表于 2025-1-31 13:15
今年AMD的AI 395 MAX 理论也有128G统一内存,分96G显存可以一试

我也是非常期待这个cpu, 但是现在推出的ai 9 370, 都是主板集成内存, 只有32G, 都要快6000. 如果扩到128G, 代价也不会太低。macbook pro 主要是ollama 在上面运行, 真的做到内存显存一体, 体验非常好。
工作机: MBP 14 2023,  X1E G5, MBA M1, SurfaceGo2LTE, X1C 2021
VM: VM*,E15 G2(40G内存 2TB)
陈列/备用:W540, X1C 2017和2018, Surface Pro 5,T430s,X230, X61
回复 支持 反对

使用道具 举报

36

回帖

1

积分

1875

资产值

初级会员 Rank: 1

注册时间
2013-10-23
发表于 2025-1-31 16:43:18| 字数 74| - 中国–江苏–苏州 电信 | 显示全部楼层
刚刚使用 T14P,64G U9 185H,4050 6GB  能够跑32B的,但是系统很慢,资源直接80%。但是现在Intel NI一直都参与计算。好像没啥用。
回复 支持 反对

使用道具 举报

xdni336 - T50-56

1万

回帖

266

积分

10万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2003-3-19
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)金牌荣誉勋章(注册20年以上会员)年全勤勋章2023年全勤勋章2024
发表于 2025-1-31 18:18:45| 字数 169| - 中国–香港 电讯盈科有限公司 | 显示全部楼层
QUOTE:
sunll001 发表于 2025-1-31 16:43
刚刚使用 T14P,64G U9 185H,4050 6GB  能够跑32B的,但是系统很慢,资源直接80%。但是现在Intel NI一直都 ...

显卡内存太低了,起码得4070的12G, 才能跑8B, 32B得用64GB得MBP, 或者2块4090的PC来跑, 也可以用80GB显存的H100来跑。

点评

回复@and250 : 8B的文件大小都5G, 4050 6G比较吃力, 4060 8G应该够了  发表于 2025-1-31 23:09
回复@and250 : 是这样的,有个人就是买了128G m4max跑llm, 4万多, 但对比专业显卡来说,就不贵了。而且特别省电。  发表于 2025-1-31 23:07
32B的话在显存里大约19G,需要24G显存的卡才流畅,70B的需要50G以上显存,如果不是多卡只能128G的mac了  发表于 2025-1-31 22:27
8B的话不需要12G显存,8G的4060就够了,ollama家应该都是Q4,这货大约占5.8G显存,Q5的话可能更大点  发表于 2025-1-31 22:24
工作机: MBP 14 2023,  X1E G5, MBA M1, SurfaceGo2LTE, X1C 2021
VM: VM*,E15 G2(40G内存 2TB)
陈列/备用:W540, X1C 2017和2018, Surface Pro 5,T430s,X230, X61
回复 支持 反对

使用道具 举报

643

回帖

11

积分

2016

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2020-11-24
发表于 2025-1-31 22:19:42| 字数 176| - 美国–纽约州–拿骚–牡蛎湾 Cablevision系统控股公司 | 显示全部楼层
QUOTE:
xdni336 发表于 2025-1-31 07:27
18G  跑8B 没问题,很流畅, 一般个人用到的场景都有了。 我一直想买个128G m4max, 跑32B和70B, 只是手 ...

M4跑8B大概多快啊?一个6000token的问题半分钟还是几秒钟?windows机器如果没独立显卡的话8B会掉到每秒十几token,一个问题超过五分钟,即使128G内存也没用
回复 支持 反对

使用道具 举报

643

回帖

11

积分

2016

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2020-11-24
发表于 2025-1-31 22:20:49| 字数 120| - 美国–纽约州–拿骚–牡蛎湾 Cablevision系统控股公司 | 显示全部楼层
本帖最后由 and250 于 2025-1-31 22:22 编辑
QUOTE:
xdni336 发表于 2025-1-31 07:32
要显卡才能快啊, CPU 做GPU, NPU的事情太慢了。

Windows笔记本上的5系显卡在deepseek看来跟集显一样完全不认

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
回复 支持 反对

使用道具 举报

xdni336 - T50-56

1万

回帖

266

积分

10万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2003-3-19
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)金牌荣誉勋章(注册20年以上会员)年全勤勋章2023年全勤勋章2024
发表于 2025-1-31 23:01:19| 字数 344| - 中国–香港 腾讯云 | 显示全部楼层
QUOTE:
and250 发表于 2025-1-31 22:20
Windows笔记本上的5系显卡在deepseek看来跟集显一样完全不认

不是不认, 你要装nvideo设置程序, 把ollama或者类似的工具设为显卡优先。

我是用macbook pro, 跑deepseek 8b 和14b 都没问题, 这是8b下写一篇过年文章的性能
total duration:       25.973440709s
load duration:        35.5095ms
prompt eval count:    18 token(s)
prompt eval duration: 301ms
prompt eval rate:     59.80 tokens/s
eval count:           754 token(s)
eval duration:        25.635s
eval rate:            29.41 tokens/s

工作机: MBP 14 2023,  X1E G5, MBA M1, SurfaceGo2LTE, X1C 2021
VM: VM*,E15 G2(40G内存 2TB)
陈列/备用:W540, X1C 2017和2018, Surface Pro 5,T430s,X230, X61
回复 支持 反对

使用道具 举报

643

回帖

11

积分

2016

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2020-11-24
发表于 2025-2-1 05:56:42| 字数 267| - 美国–纽约州–拿骚–牡蛎湾 Cablevision系统控股公司 | 显示全部楼层
本帖最后由 and250 于 2025-2-1 05:58 编辑
QUOTE:
xdni336 发表于 2025-1-31 23:01
不是不认, 你要装nvideo设置程序, 把ollama或者类似的工具设为显卡优先。

我是用macbook pro, 跑deeps ...

主要还是这个十四年前的低端独显太弱了吧,毕竟还不如现在最弱一百刀上网本的集显,性能只有现在4060的 0.5 %?

8b只能60 token/S的话那感觉也就是现在CPU直接跑的三倍,好像也挺慢的,比目前的入门级独显比如4060速度低80%?但14b估计两者差不多,因为windows一旦出了显存就完蛋
回复 支持 反对

使用道具 举报

xdni336 - T50-56

1万

回帖

266

积分

10万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2003-3-19
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)金牌荣誉勋章(注册20年以上会员)年全勤勋章2023年全勤勋章2024
发表于 2025-2-1 06:13:23| 字数 383| - 中国–香港 腾讯云 | 显示全部楼层
本帖最后由 xdni336 于 2025-2-1 06:14 编辑
QUOTE:
and250 发表于 2025-2-1 05:56
主要还是这个十四年前的低端独显太弱了吧,毕竟还不如现在最弱一百刀上网本的集显,性能只有现在4060的 0. ...

也许你要求有点高,毕竟不是专业显卡 H100之类的, 你看看RTX 4070运行deepseek-r1 8b的表现, 这种测试不是专业的,每次都不一样,就当娱乐一下:


total duration:       19.6593597s
load duration:        22.8464ms
prompt eval count:    9 token(s)
prompt eval duration: 365.56ms
prompt eval rate:     24.62 tokens/s
eval count:           1212 token(s)
eval duration:        19.269085s
eval rate:            62.90 tokens/s
工作机: MBP 14 2023,  X1E G5, MBA M1, SurfaceGo2LTE, X1C 2021
VM: VM*,E15 G2(40G内存 2TB)
陈列/备用:W540, X1C 2017和2018, Surface Pro 5,T430s,X230, X61
回复 支持 反对

使用道具 举报

xdni336 - T50-56

1万

回帖

266

积分

10万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2003-3-19
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)金牌荣誉勋章(注册20年以上会员)年全勤勋章2023年全勤勋章2024
发表于 2025-2-1 06:20:05| 字数 140| - 中国–香港 腾讯云 | 显示全部楼层
QUOTE:
and250 发表于 2025-2-1 05:56
主要还是这个十四年前的低端独显太弱了吧,毕竟还不如现在最弱一百刀上网本的集显,性能只有现在4060的 0. ...


另外:
我那个Mbp的cpu上代入门版,如果换成新的M4 pro/max,数字要好看的多, 不会低于4070/4080.
工作机: MBP 14 2023,  X1E G5, MBA M1, SurfaceGo2LTE, X1C 2021
VM: VM*,E15 G2(40G内存 2TB)
陈列/备用:W540, X1C 2017和2018, Surface Pro 5,T430s,X230, X61
回复 支持 反对

使用道具 举报

5万

回帖

348

积分

15万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2008-12-13
年全勤勋章2020银牌荣誉勋章(注册10年以上会员)年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-3 15:12:32| 字数 3| - 中国–上海–上海 电信 | 显示全部楼层
厉害了
X62 5500U; 10G RAM; 64G Msata
Retina MBP ME865
回复 支持 反对

使用道具 举报

2884

回帖

56

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2011-4-5
银牌荣誉勋章(注册10年以上会员)
发表于 2025-2-3 15:35:14| 字数 151| - 中国–陕西–西安 电信 来自iOS客户端 | 显示全部楼层
QUOTE:
xdni336 发表于 2025-1-31 18:18
显卡内存太低了,起码得4070的12G, 才能跑8B, 32B得用64GB得MBP, 或者2块4090的PC来跑, 也可以用80GB显 ...

我M3 Pro 16G内存,23年的机器跑14b,倒还算流畅,就是准确率太差,感觉模型信息太少以及老旧,实用性不强
MacBook Pro 2023 16
Macbook Air 2022 13
X1C 2021 14
T480 14
HP 830 G5 13
Surface go 10
MacBook 12
MacBook Pro 2019 13
MacBook Pro 2015 15
INTEL NUC8
回复 支持 反对

使用道具 举报

xdni336 - T50-56

1万

回帖

266

积分

10万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2003-3-19
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)金牌荣誉勋章(注册20年以上会员)年全勤勋章2023年全勤勋章2024
发表于 2025-2-3 16:23:32| 字数 187| - 中国–香港 腾讯云 | 显示全部楼层
QUOTE:
lxprote 发表于 2025-2-3 15:35
我M3 Pro 16G内存,23年的机器跑14b,倒还算流畅,就是准确率太差,感觉模型信息太少以及老旧,实用性不 ...

数据量太少了, 14b也就10G左右的数据量, 作为一个离线百科全书就只能玩玩, 实用还得用online的。

国内有一些公司不允许上外网, 买个128G的m4 max,  用来离线运行70b的大模型, 对开发就有意义了。
工作机: MBP 14 2023,  X1E G5, MBA M1, SurfaceGo2LTE, X1C 2021
VM: VM*,E15 G2(40G内存 2TB)
陈列/备用:W540, X1C 2017和2018, Surface Pro 5,T430s,X230, X61
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc

GMT+8, 2025-2-5 20:00 , Processed in 0.104274 second(s), 35 queries , Gzip On, OPcache On.

手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|在线留言|专门网

返回顶部