依旧少年芯
引领x86变革的英特尔酷睿Ultra 200S桌面端处理器技术解读
今天的主要话题正是针对酷睿Ultra 200S,我们会在10月10日解禁期第一时间为大家解读。对我们这样的DIY老玩家来说,新产品有一层非常特殊的意义——便是英特尔的产品命名终于告别了使用二十多年的“i”,转而全面使用“Ultra”,而台式机处理器也不再使用以往的13、14代处理器的代际命名,这次将全部统一为英特尔酷睿Ultra桌面端处理器(第二代),以后你再把Arrow Lake称为15代酷睿,就不免有些不专业了。
虽然我们对i命名有着非常深厚的感情,但还是要看到Ultra对于英特尔重大的创新变革意义,其实从英特尔移动端处理器来看,四代产品就进行了三代构架变化,英特尔希望通过构架变化推动x86构架处理器进化的意图非常明显——英特尔还是那个蓝色巨人,欲戴王冠,必承其重,在苹果已经让M系列处理器的能效比推到新的高度之时,英特尔承担起追赶的重任。我也相信,其CEO帕特心中还住着一位少年,从技术出发重回巅峰,是他固执且坚持的初心,上任初掷地有声的要拉回苹果这样的客户,现在看来,英特尔正在产品路线图上一一这么实践着。
构架变革,制程提升,“两条腿”加速
谈回酷睿Ultra 200S,我们会发现,它的架构非常像前一代的Meteor Lake,同样采用分离式模块设计,将处理器分为CPU、GPU、NPU和IO四个Tile。在发布Meteor Lake时我们便探究了为何台式机平台为何没能跟上架构更新,事实是新架构在推动高能效比的情况下很难承载高性能的需求,而在酷睿Ultra 200S上,英特尔通过改变总线设计与资源调度策略等方式实现了向高性能台式机平台上的技术平移,所以酷睿Ultra 200S中的Ultra可谓实至名归。
值得注意的是,与之前Lunar Lake的CPU Tile采用台积电工艺类似,只不过这次Arrow Lake更加激进——其CPU Tile采用台积电N3B制程工艺;GPU Tile采用N5P制程工艺;IO和SOC Tile采用N6制程工艺;最后采用英特尔3D封装技术Foveros,在英特尔工厂完成最后封测。我从各个方面打探英特尔采用台积电代工的原因,按英特尔的说法,未来英特尔并不介意用自有产能和台积电产能两条腿走路。在我看来,这样的方式已经不是走路了,而是在制程工艺路线上奔跑了。
全面采用台积电的制程工艺,很是有些卧薪尝胆的意味了,在消费端放弃Intel 3,甚至未来还有可能继续放弃Intel 20A,放手一博Intel 18A(这样的猜测未必无因,英特尔近期大力推动Intel 18A的代工,而且在制程工艺路线图上已经推出了下一代的Intel 14A,它极有可能是采用更为先进的NA EUV光刻机来生产,考虑到英特尔是最早布局NA EUV的,重回制程领先是完全有可能的),在最重要的消费端处理器上直接拉动IDM制程工艺飞跃,这样的勇气无不让人钦佩。
与以往技术解析不同,我们这次先直接公布酷睿Ultra 200S的SKU。这次酷睿Ultra 200S共发布了5个SKU,除了Ultra 9 285K、Ultra 7 265K、Ultra 5 245K三款常规带K的处理器外,Ultra 7和Ultra 5还提供了两款不带iGPU的KF处理器。
我们拿一颗前代i9-14900K与Ultra 9 285K来比较外观,两者的基板尺寸均为37.5mm×45mm×1mm,带顶盖的整体厚度均为4.4mm。从外观上看,两者仅是防呆口不同。虽然酷睿Ultra 200S的接口从LGA1700改为了LGA1851,但实际上仅是处理器四周各增加了一排接口,以满足新一代处理器在扩展、带宽上的更大需求。这样的设计无疑对消费者是更有亲和力的,大家应该记得在AMD很早就全面弃用DDR4内存时,英特尔之前的多代产品依旧保持同时兼容DDR4和DDR5,这对用户无缝升级是有极大亲和力的。此次虽然主板换用全新的芯片组,但处理器相同的物理尺寸可以让用户继续使用之前的散热器扣具,要知道一台高性能水冷模组的价格并不便宜。
ITD搭台、E核唱戏,单/多核性能双提升
从参数上,旗舰款的处理器酷睿Ultra 9 285K依旧是8P核16E核的配置,值得注意的是,新一代处理器全系取消了超线程,线程数从36个减到了24个,但CPU多线程性能不降反增,代际提升达到了17%,原因便是核心算力的提升带来的。
酷睿Ultra 200S采用了全新的性能(P)核和能效(E)核,代号为Lion Cove和Skymont ,代际IPC分别提升了9%和32%。P核最大频率虽然降到了5.7GHz,但性能却是反向提升的;特别是新E核,更是以能效核的效能实现了前代性能核的性能,说法有些拗口,其实最终就是反映在超过30%的性能爆涨上。为何英特尔这代台式处理器会将升级主要放在E核上,原因便是这代硬件调度策略的改变,全新的硬件线程调度器(ITD),采用了E核优先的调度策略,也就是让E核优先作为常备“值班”核心,来面对日常负载不重的生产力软件。提升E核性能不仅保证了CPU Tile的低能耗,也能展现出不错的低负载场景下的性能。
这张图还我们揭示了P核和E核的一些新技能:比如能效核的L2缓存带宽提升了2倍,并拥有更深的队列深度、扩展性也大大增强、预测、分配、撤出指令也分别得到了增强与优化;而P核则继续拆分乱序引擎,提升命中率,并采用了更宽泛的预测与更广泛的调度,加上引入了基于AI的电源管理,其实整体都有脱胎换骨的变化。
谈到这里,我们还是有必要跟大家解释一下酷睿Ultra 200S为何会取消超线程。事实上,大家完全不必“迷信”超线程,要知道,这项技术在英特尔产品线中已经有22年时间了,最早用在至强处理器上,用于解决实体核心不足的情况。而在英特尔推出P核+E核的混合架构后,加上核心数量完全能够满足消费端需求的当下,一味追求线程数量并没有意义,反而同一核心在分配两个逻辑线程的任务时,反而会造成核心性能的损失。在E核已经充分弥补核心数量的时候,也是时候让超线程退出历史舞台了。正因如此,酷睿Ultra 200S在追求能效比,降低P核频率时,依旧有9%的性能提升,同时单线程和多线程的算力都在原有基础上有了新的提高。
除了超线程,酷睿Ultra 200S同样也不再使用AVX-512指令集,仅支持AVX-2和VNNI。如今看来,英特尔一直在x86构架上推动复杂指令集“简化”,根子上其实也是在为硬件减负,的确在Arm构架的冲击下,x86构架虽然有过去数十年打下的广泛兼容性的江山,也需要未雨绸缪,在能效比路线上迎头赶上。率先做出这样改变的,仍是英特尔!
相同性能、功耗减半,这次轮到x86构架主动进攻了
在谈及性能时,我们一再提及“能效比”,采用分离式模块架构其实也是为实现这一设计目标。相信大家也都非常关注,这一代酷睿Ultra 200S能效比提升有多大呢?
如果与前代酷睿i9-14900K相比,酷睿Ultra 9 285K的性能在Geekbench 6、SPECCate 2017、Cinebench 2024和3DMark CPU Profile中实现了单核与多核成绩的全面超越,而且比起AMD 9950X也有明显的优势。其中单核代际提升有8%,竞品对比提升有4%;多核代际提升有15%,竞品对比提升有13%,可以说英特尔依旧还是掌握了台式机处理器的性能话语权。
而比起酷睿i9-14900K,酷睿Ultra 9 285K的功耗降低更是达到了58%,虽然测试项目引入了Office、Zoom这样负载较轻的软件。
如果直接划出能效曲线,便能客观说明问题:酷睿Ultra 9 285K以125W的功耗,达到了酷睿i9-14900K 250W功能的性能,所以相同性能、功耗减半,并不是一句虚言。另外,酷睿Ultra 9 285K的整个曲线同样也全面优于AMD 9950X,这是制程工艺和新构架共同带来的改变。
对消费级玩家来说,台式机很大机率是要用来玩游戏的,英特尔展示了一张非常有意思的图表:可以看到即使将酷睿Ultra 9 285K的PL1默认250W的功耗降到仅有一半的125W,游戏帧数基本保持一致(7款游戏)。
降低TPD,游戏性能不变,这很有些“反向超频”的意味。有些玩家会问,这样设计有何意义?单纯考量CPU,的确这样设计感觉有些多此一举,但放在整个台式机平台上,这样的设计会带来很大的隐藏优势:首先,降低一半的CPU能耗能够降低台式机平台在游戏中平均80W的功耗,联想到英伟达明年发布的RTX 5090显卡据传将功耗定到了600W,主板和电源厂商想要不升级供电去做适配,就得好好地感谢英特尔这一波处理器升级省下的功耗。
另外,功耗降低这么多,相对应的散热压力就会小上不少,而且在CPU基板和散热上盖没有变化的情况下,英特尔工程师还想了个小“花招”,让P核和E核集群间插放置(在IDF德国构架沟通会时,英特尔处理器构架还没展示这一变化,说明产品下线前,英特尔一直在致力做一颗更低温、更安静的台式机处理器),让发热更均衡。
这张图上还提示了一个缓存上的小“秘密:除了P核的L2缓存由2MB提升为3MB之外,36MB的三级缓存由全部核心共享。了解半导体行业的朋友其实都留意到了,全核共享缓存在高通、MTK等厂商的最新芯片中都采用了类似的设计,该类设计在手机芯片中已经非常普遍,这能够平衡负载,节省能耗,提升E核的命中率。
所有因素综合,最终使CPU表面温度降低了13℃。发热的下降,给台式机市场带来了巨大的想象空间——这让OEM制造更小的游戏主机更为容易,特别是未来搭配恢复到170W供电的5060,结合氮化镓供电的优势,这样的硬件组合完全可以放入比PS5 Pro更小的机箱中去,考虑到x86平台广泛的兼容性与光追性能的优势,那不比一台PS5 Pro更贴心?
当然,并非每一款游戏节省的能耗都是一样的,像GPU负载更重的《黑神话:悟空》这样的3A大作,节省的能耗会小一些,而像《战锤:空间陆战队2》这样需要CPU参与物理计算更多的游戏,节省的能耗就会更多,最多达到165W。
新核显,带来更多生产力加成
对于台式机处理器来说,显示配置更多要依靠独立显卡来支撑游戏、渲染等娱乐和工作流,但是英特尔依旧在酷睿Ultra 200S上大力升级了核芯显卡。可以看到,酷睿Ultra 200S全系列的核显均升级为4核心Xe LPG核显,拥有4光追单元,拥有4MB的L2缓存。除了支持DX 12 Ultimate和XeSS外,还支持硬件DP4a,专门针对卷积神经网络CNN以及大规模整数运算场景进行优化。
其实在整个核显中,提升最大的是采用了全新的编解码器,它将继续巩固英特尔在这方面的优势。与AMD 9950X相比,它拥有最高8倍的回放速度,并且渲染速度也超出了20%。对于很多创作与多媒体娱乐用户来说,这是极为重要的功能,在他们看来,去掉核显省下少量成本的KF系列顿时就不香了。最后,我们送上新编解码器支持的编码格式清单,供专业用户参考。
硬件解码支持清单 |
|
|
|
编码格式 |
配置 |
等级 |
最高分辨率 |
MPEG2 |
Main |
Main - 15Mbps |
FHD |
High - 40Mbps |
|||
AVC/H264 |
High |
L5.2 |
4K |
Main |
|||
Constrained Baseline |
|||
4:2:0 8bit |
4K@60 |
||
JPEG/MJPEG |
Baseline |
Unified Level |
16K x 16K |
HEVC/H265 |
Main12 420, 422, 444 - 8b/10b/12b |
L6.1 |
8K@60(Decode Only) |
SCC 420, 444 - 8b/10b |
8K@30(Decode Playback) |
||
VP9 |
0 (420 8b) |
Unified Level |
8K@60(Decode Only) |
1 (444 8b) |
8K@30(Decode Playback) |
||
2 (420 10b/12b) |
16K x 4K |
||
3 (444 10b/12b) |
|
||
AV1 |
Main (420 8b/10b) |
L6.1 |
8K@60(Video, Decode Only) |
8K@30(Decode Playback) |
|||
16K x 16K (still picture) |
硬件编码支持清单 |
|
|
|
编码格式 |
配置 |
等级 |
最高分辨率 |
AVC/H264 |
High |
L5.2 |
4K@60 |
Main |
|||
Constrained Baseline |
|||
JPEG |
|
|
16K x 16K |
HEVC/H265 |
Main10 422 - 8b/10b |
L5.2 |
8K@60(Decode Only) |
Main |
L6.1 |
4320p(8K) @60 |
|
Main 10 420, 444 -8b/10b |
|||
SCC 420, 444 - 8b/10b |
|||
VP9 |
0 (420 8b) |
- |
8K@30 |
1 (444 8b) |
|||
2 (420 10b) |
|||
3 (444 10b) |
|||
AV1 |
Main (420 8b/10b) |
L6 |
8K@30 |
NPU加入,带来强大的XPU平台AI算力
在英特尔对酷睿Ultra 200S的新定义上,提出了这是“英特尔首款台式机AI PC处理器”的概念,主要原因便是NPU在全线产品上的加入。的确,人工智能将在未来几年内开始改变游戏体验,同时还会提升生产力工具的效率。在过去的一年里,像Adobe、Blackmagic Design、Magics 等ISV的内容创作与商业用户的AI功能正大规模爆发,像我们身边,办公助手、AI助力正越来越多地承担了以往需要大量时间堆积的“搬砖”工作。
英特尔给酷睿Ultra 200S加入的NPU,实打实地给了int8 13TOPS的算力,加上CPU的15TOPS和iGPU的8TOPS,整个处理器平台AI算力总共36TOPS。有朋友要说,为何新的台式机处理器达不到Windows 12要求的40TOPS系统AI算力,说实话,目前Copilot AI助手并没有展现出应有的系统级AI能力,反而之前大力投入的移动端NPU算力反而没有相应的系统级应用来支持。相信大家也回过味儿来了,如今的AI PC,最重要的是把自己的生态做上去,反观几家芯片厂商,除了封闭的苹果,英特尔才是把NPU适配做得最好的厂商,从2023年到 2024年,我们看到英特尔帮助启用AI功能数量增长了10倍,同时,英特尔还是唯一一个在每个加速器上都支持DirectML和所有主要数据类型的供应商。
与ISV的合作上,英特尔已经建立了与100多个ISV的应用软件的300多项AI功能支持,新增加支持或即将支持的针对客户端优化的大语言模型包含了:Microsoft Phi-2、Phi-3、LLaMa2-7B、LLaMa3-8B、Mistral-7B、Qwen 7B 、ChatGLM3 6B,不乏来自中国的本地大模型;另外还与OEM合作,新支持了Acer Sidekick、Lenovo AI Now等AI助力,提升用户的端侧AI体验。
当然英特尔也意识到,仅一个NPU不足以应对AI软件的多样化需求,英特尔提供的是一个CPU+GPU+NPU的全平台XPU的AI算力,相对酷睿i9-14900K,酷睿Ultra 9 285K在Geekbench AI性能和UL Procyon AI计算机视觉性能基准测试中,GPU性能有着2倍的提升,从无至有的NPU也带来了更多AI软件的适配性,据英特尔称,2025年将有大约5%的功能将转移到NPU上。
相对竞品AMD 9950X,酷睿Ultra 9 285K也在多项软件中有明显的超越,最大拥有50%的性能提升。
英特尔近期公布了一个与游戏厂商开发的Cephable插件,可以用CPU、GPU和NPU分别承担一部分软硬件调度工作,用于简化与自定义游戏的热键操作,还能通过AI采集玩家表情和头部运动转化为游戏操作,其中,NPU便是承担了面部与语音识别的交互功能。
全新800系列芯片组,适配更强扩展能力
来到芯片组,由于更新到LGA1851,所以英特尔也是会和处理器一同发售全新的800系列芯片组和Z890系列主板。细心的朋友可以看到Z890上的PCIe通道比Z790少4条,事实上,英特尔是将这4条通道移动到CPU上(这得益于LGA1851增加触点带来的带宽增益),并为它们提供了PCIe 5.0的规格,CPU直连+芯片组提供的总体PCIe端口还是48个,无疑是升级了。
这次最大的提升依我看则是支持两个原生板载雷电4接口,虽然最多支持到4个雷电5,但需要主板厂商加装独立控制器。其余的大多都是基本升级,比如800系列芯片组的CNVi依旧仅支持Wi-Fi 6,需要独立Wi-Fi 7,需要额外占用PCIe通道,当然,目前中国用户还是用不上的。
内存上,新芯片组支持到了PL1最高DDR5 6400,主要扩展了带宽,每DIMM最高可支持到48GB,总体最高可支持到192GB,相信这样的升级能够大大提升插满4DIMM内存插槽后的总体频率,有机会我们也会给大家测测看。另外,SODIMM和CSODIMM都是新支持的接口规格,目的也是为了扩展内存带宽。
对于超频,英特尔并没有因噎废食,13/14代酷睿处理器电压过高的问题其实锅并非全部应该由英特尔来背,主板厂商为了达成更好的超频效果,修改了部分BIOS的默认设置,加主Windows系统性能模式的硬件策略,共同造成了这一后果,按道理,其实后两者的责任更大。
在酷睿Ultra 200S上,英特尔重新合成了超频调优控件,比如将之前100MHz的频率步进,分割为了更细的16.67 GHz,能够让玩家更为精细地控制超频;另外,英特尔双 BCLK 调优使用户能够独立地调优计算和SoC 芯片,而新的OEM定义电压限值功能有助于防止用户超频时超过指定的阈值,另外,英特尔还增加了DLVR绕行机制,可以让用户在XTU超频软件中逐核调节电压,即使主板厂商与操作系统“放卫星”,也不会导致电压过高的老化问题。诸如XMP支持DDR5内存超频则是英特尔一直以来的常规操作,不再展开。
送上最后彩蛋,并跟大家预约24日的评测首发
最后环节按惯例自然是要放个重大彩蛋的。在这次发布的所有SKU中,我重点给大家推荐酷睿Ultra 7 265K,它不仅性能仅比14900K仅差5%,而且温度降了15℃,最惊人的是系统功耗降了188W,可以说是最接近U9的U7处理器了。
可以说,英特尔的产品经理是越来越懂用户了,在性能提升如此大的情况下,酷睿Ultra 7 265K在价格上更是比Ultra 9 285K低了近两百美元。适逢架构解密时京东也公布了酷睿Ultra 200S五款SKU的价格,可以看到两款产品的国内价差也达到1600RMB,与美元价差几乎相同。看来英特尔这次是真的活懂了,终于拿出在性价比上超越7500、7600等中端竞品的“终结者”了。
顺便在这里,我跟大家预约10月24日的酷睿Ultra 200S的首测,遗憾的是英特尔首先送测的还是Ultra 9和Ultra 5的高、低定位的两款产品。酷睿Ultra 7 265K的评测,我们拿到样品后也会第一时间送上评测。
第一时间,我们也拿到了微星的MAG Z890 ACE主板和MAG CORELIQUID I360水冷散热器,他们的扩展性和新功能有什么增加?有哪些额外的良心升级?还有哪些不少让人惊艳的小设计?甚至散热器兼容性怎样?我们都会在24日全部揭晓!
写在最后:酷睿Ultra 200,你怎么看?
如何评价全新的英特尔酷睿Ultra 200,我想各位读者心目中都有一个整体的印象了。相信大家记忆最深刻的便是x86构架最出色的能效比,以及XPU加持下的平台级AI能力。
如果从用户场景来看,英特尔也公布了与AMD最强游戏处理器7950X3D的比较结果,5个主流游戏的平均成绩来看,基本五五开的水准,相对而言,内容创建的5个生产力软件就超出不少了。在我看来,生产力其实还是这一代处理器最明显提升之处。
加载更多