AMD顶级APU展现实力!锐龙AI Max+ 395跑DeepSeek R1:比RTX 5080快3倍以上

内容摘要快科技3月18日消息,AMD展示了其最新的锐龙AI MAX+ 395 “Strix Halo” APU在DeepSeek R1 AI基准测试中的表现,比NVIDIA RTX 5080桌面版显卡高出3倍以上。锐龙AI MAX+ 395 “St

快科技3月18日消息,AMD展示了其最新的锐龙AI MAX+ 395 “Strix Halo” APU在DeepSeek R1 AI基准测试中的表现,比NVIDIA RTX 5080桌面版显卡高出3倍以上。

锐龙AI MAX+ 395 “Strix Halo” APU集成了16核、32线程的Zen 5架构处理器、50 TOPS的XDNA 2神经处理单元(NPU)和集成显卡。

RTX 5080显卡仅配备16GB的VRAM,这在处理大型语言模型时成为明显的瓶颈,而Strix Halo APU的128GB统一内存可以灵活分配,最多可将96GB内存转换为显存,使其在处理大型AI模型时具备显著优势。

在实际测试中,AMD使用了包括llama.cpp驱动的应用程序LM Studio在内的多种消费者AI工作负载进行基准测试。

结果显示,当LLM模型大小超过16GB VRAM时,Ryzen AI MAX+ 395的性能优势尤为明显,其性能比RTX 5080高出3.05倍。

即使与更高端的RTX 5090(32GB显存)相比,Strix Halo APU的128GB统一内存依然使其在处理大型模型时占据绝对优势。

AMD表示,锐龙AI MAX+ 395相较于Copilot+竞品的优势主要如下:

性能:

与英特尔Arc 140V相比,最高提升2.2倍的token吞吐量

最高可达4倍于Llama 3.2 3b Instruct等小型模型的首个token生成时间

最高可达9.1倍于7-8B参数模型的速度

14B参数模型最高比英特尔酷睿Ultra 258V快12.2倍

内存:

提供高达128GB的统一内存,而竞争对手的最大仅为32GB

可将高达96GB转换为显存

可运行其他APU无法处理的更大模型,如谷歌Gemma 3 27B Vision

【本文结束】如需转载请务必注明出处:快科技

责任编辑:黑白

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备2021030705号-9