英特尔全新至强W带来工作站26%的AI性能提升
60全性能核加“i+i”推动工作站方案落地千行百业
8月29日,英特尔发布了2024年新一代英特尔至强W工作站处理器,从型号上来看,它包含至强W-3500和至强W-2500两个系列,从产品代号来看,“Sapphire Rapids Refresh”延用了上一代全性能核的构架,其旗舰型号至强w9-3595X处理器将核心数一举提升到60个,线程数据也达到120个,在工作站应用中,区分核心大小作用并不大,不少应用场景都是将所有线程全路跑满,增加性能核心数据量无疑能够进一步拓展工作站产品的性能上限。
最高60性能核、120线程,带来更好的性能上限与平台扩展性
我们还看到,W-3500和W-2500处理器睿频最高达到4.8 GHz,最高配置的SKU w9-3595X的L3缓存提升到了112.5 MB,个别型号上,诸如至强w9 3575x与前代同型号w9 3475x相比,增加了8个内核,诸如至强w5 3525与前代同型号w5 3425相比,缓存提升了1.5倍;另外,这一代处理器支持8通道DDR5 RDIMM内存,传输速度高达4800MT/s,最高提供4TB的内存容量;值得一提的是,W-3500处理器最多拥有112条直连CPU的PCIe Gen 5.0通道(至强W-2500处理器最多64条),可以扩展出多个GPU、SSD和网卡;拥有更为出色的扩展性能,在如今AI训练和推理需求非常高的当下,平台的扩展性同样决定AI性能的上限。
以往工作站产品主要应用在媒体和娱乐、生命科学、工和设计和金融服务等领域,随着人工智能的应用浪潮,千行百业都在推动丰富的AI开发,用于提升行业效率和技术前景。至强W相对个人电脑平台,不仅是硬件规格的强大,更是配合英特尔强大的软件能力来提升AI的执行效率。
我们可以看到,在新一代至强W-3500和W-2500处理器平台上,支持第三代英特尔深度学习加速AMX(Bfloat16)和英特尔高级矢量扩展(AVX-512),在进行人工智能训练和推理时可获得更为出色的加速能力,特别是用于关键数据科学和人工智能开发工作方面,整体性能提升达到26%。另外我们还可以看到,全新至强W系列同样拥有ECC内存、RAS技术和DDR5 XMP 3.0 RDIMM内存超频功能,尤其是加入了英特尔vPro Enterprise的安全功能、远程可管理等技术特性,便于工作站产品在企业环境中部署。
代际性能提升明显,“i+i”方案降低了工作站门槛
从代际性能来看,60性能核120线程的全新英特尔至强W-3500处理器系列相较前代W-3400新增了4到8个核心,多线程性能对比前一代提高了10%;26性能核52线程的的全新英特尔至强W-2500处理器系列新增了2个核心,多线程性能对比前一代提高了11%。
在SPEC WORKSTATION 3.1的6个行业需求的典型性软件测试项上,全新至强w7 2595X(26核-Sapphire Rapids-Refresh)相对之前的至强W2295 (18核-Cascade Lake),,都拥有非常显著的提升,像生命科学领域最高拥有104%(超过一倍)的性能提升;即使相对上一代至强w7 2495X(24核-Sapphire Rapids)在特别在工程设计、能源行业和通用计算上,都有着近乎1倍的性能增加幅度。
如今中国的媒体和内容创作行业蓬勃发展,配备全新至强W处理器的工作站也将为媒体行业提供更高算力。可以看到全新w9-3595X(60核-Sapphire Rapids-Refresh)比W-3275(28c-Cascade Lake)在渲染项目上提升最高达到2.4倍,在视频放大速度的提升上达到4.3倍。
最令我们感兴趣的是,英特尔在现场提供了一个至强W处理器+多块消费级Arc显卡的“i+i”方案,分别提供了从2万元到10万元级别的不同配置,大大降低了工作站产品的价格门槛,这让像我们一样的媒体团队也能够用得起工作站产品,也能够享受至强W上那些优秀的技术特性。关于如此在PCIe通道上如何实现多GPU的复用,英特尔在发布会上并没有多讲,但接下来我们也希望通过评测新一代至强W给大家解读:这会不会是比NV Link更优秀的多卡复用方案,拭目以待。
英特尔与OEM合作伙伴一起展示更具延展性的工作站方案
发布会现场,英特尔邀请了14家OEM、渠道商展示了针对AIGC、金融、影视后期、建筑设计、云计算等领域的中国本土应用解决方案,针对新一代至强W在AI生产力上体现出的旺盛需求,英特尔中国区商用客户端销售总经理傅彬向我们讲道:“英特尔作为AI行业生态领导企业,我们与全球及本土ISV提供了更多软硬一体化的AI应用优化及解决方案,积极推动企业利用AI打造“新智”生产力。至强W处理器作为专业的工作站处理器,为诸多行业,比如教育,金融,制造以及高密集计算的影视后期,渲染,仿真,3D建模等应用场景提供了安全稳定的澎湃算力,为企业打造核心竞争力。”
基于英特尔在至强W平台上多年投入,尝试参与到本地ODM的产品生态中,如今我们已经能够看到针对至强W平台的专用机箱、散热等配件,它们让传统工作站产品更具延展性;另外OEM也可提供2U/4U 机架式产品、便携式高性能计算平台等,都为不同的使用场景提供了针对性设计。
现场我们可以看到各个OEM和合作伙伴提供的应用于媒体娱乐、工程设计、生命科学、能源和地质科学、金融服务、数据科学和AI开发等领域的行业解决方案。如今的工作站方案除了在满足行业需求上更有针对性,并且更加关注中国本地化AI/AIGC需求的发展,所以产品与方案更看重差异化。
相较于注重端侧应用和TCO的传统工作站,基于至强W平台的方案则开始向边缘侧以及云侧延展,尤其是大边缘计算时代带来的需求,都给了至强W平台更广阔的发展空间,能够更好地满足金融、建筑、AI、大语言模型等强算力需求的领域,也包括户外转播、地理信息工程等便携高计算需求的场景。比如建立在英特尔多卡大语言模型方案上的高性价比的融科one解决方案,搭建了高效易用的AI算力平台;比如华栖云的智能教育实践方案,让媒体与娱乐行业应用更为丰富;腾闪的高频交易方案和AMAX工作站的量化交易策略分析技术,让金融科技如虎添翼;昱格便携式工作站实现户外勘察建模,为地理信息工作保驾护航;航天联志为工程仿真提供了强大算力底座……
针对建筑设计师对于3D工具和AI技术的更高需求,惠普带来了 “惠普智能建筑 AI一体机解决方案”,通过实时渲染技术,满足设计师实时渲染需求,所见即所得的设计理念展示,无需漫长等待,基于惠普Z系列AI一体机解决方案还有针对金融、药物计算、数字人领域的AI一体机,让AI服务行业。
针对新能源汽车设计领域,建模、大型仿真模型的前后处理计算需要巨量的画面、数据、内容等信息处理,以及后续的分析等处理,对算力、稳定、扩展性要求极高。戴尔推出的Precision 7960 Tower工作站能够以强大通用算力、稳定的机箱和性能设计以及ISV认证等,智能地为新能源汽车仿真设计需求提供高算力,助力产业革新快马加鞭。
针对AIGC和大模型领域,企业需要大模型商业化落地存在着模型幻觉、企业系统访问、自动执行任务方面的局限性,联想带来的“联想AI智能体开发推理训练一体机”则能够助力企业高效率、更智能地完成企业智能体的落地,保障智能体一体化集成、安全合规、开箱即用。
写在最后:
虽然不算是产品构架的大升级,但这一代的至强W依旧拥有不俗的代际升级,尤其是主流型号在核心数量和L3缓存上的升级,能够让各个OEM的解决方案拥有更强大性能提升。更值得关注的是,英特尔以不一样的思路切入到中国旺盛成长的AI和AIGC的需求之中,在全新至强W上嫁接多块Arc消费级显卡,“i+i”的能力打造出市场上最具性价比的工作站方案,这无疑有利于工作站产品解决“酒香也怕巷子深”的老问题,加还产品与方案在更多行业末端落地。小升级、大期待,便是我们对这一代至强W工作站处理器平台的评价。
加载更多