PC处理器史上最大的架构革命
详细解读Meteor Lake的封装工艺和架构设计思路
我回想了一下,这几乎是我近期写得最长的一段引言,非如此,不足以表达Meteor Lake的架构革新之处。而且我之前也一再强调,Meteor Lake采用了Intel 4 制程工艺,甚至比未来的Intel 20A和18A更为重要,之所以这么说,是因为Meteor Lake所采用的全新小芯片架构,基本可以确定会在未来两代产品上继续沿用,未来的较大基因变数,只剩下全新的RibbonFET晶体管工艺和PowerVia供电方案,而这两项核心技术,与制程工艺进步的关联度更高,而构架的基础形态,便是在今天的Meteor Lake上打下的。
先从英特尔擅长的封装技术聊起
说实话,对Meteor Lake的详细解读,给我有无从落笔之感,可谓处处是亮点,句句有故事。如果大家感兴趣,我不妨给大家聊得更深一些,把新一代处理器人所不知的背后故事给大家讲透了。
Meteor Lake之所有如此大的变化,最稳定的基础莫过于“封装技术”。要知道,英特尔Intel 7制程工艺的定义在于等效于友商的7nm工艺制程,而Intel 4,则是等效于友商的7nm工艺制程,它采用的其实是7nm芯片设备,所以Intel 4也是英特尔首次采用EUV光刻机的第一代个人电脑处理器产品。不熟悉半导体的朋友或许会问,英特尔不是最强大的CPU厂商吗?这其实是个老故事,是IDM和Fabless之间的选择,不再展开,大家需要明白的一点是,在喊出“无工厂、非好汉”的半导体厂商也“屈从”于Fabless时,能够加速走上“四年五个节点”快车道和开创IDM 2.0全新道路,坚持奉行的本心的英特尔是足够伟大的。
继续这个话题,英特尔的这个“等效”,是真正意义上在性能、能耗、晶体管规模和构架复杂程度上的等效,当然决定这一等效结果的因素很多,其中贡献最为便是封装技术,它让英特尔在设备制程落后时依旧占据了领先地位,过去的Alder Lake和Raptor Lake出色表现就能说明这一点。
英特尔的封装技术有何优势,或者说有何特点呢?封装,归根结底就是让主板和芯片之间的电和信号互联互通,你可以把它理解为晶元的“外包装”。英特尔最早在芯片上采用翻转芯片陶瓷工艺,从而在20年前的迅驰平台上,首次建立起笔记本移动计算平台的优势;10年前,英特尔将CPU和芯片组封装在一个芯片里,这个封装构架一直沿用至今。
最值得关注的是英特尔最近两代封装技术——CMIB 2.5D和Foveros 3D。CMIB(嵌入式多芯片互连桥接)诞生于2007年,最早应用在FPGA Stratix 10上,2023年推出的服务器以及工作站处理器Sapphire Rapids正是CMIB大规模量产的标志性产品;
Foveros(主动式3D堆叠)于2020年在一块在Lakefield芯片上正式发售,它将一颗早期的Ice Lake和4核的Atom封装为“1+4”的混合架构,而且还将内存封装于其中,是不是看到了12代、13代酷睿的影子?
Meteor Lake是第一代采用Co-EMIB封装技术大规模量产的PC处理器
2022年,英特尔首次将下2.5D和3D封装技术融合在一起,将其命名为Co-EMIB,做出了当时晶体管规模最大的SoC,这是一块面向于高性计算市场的的GPU(Xe HPC)。而Co-EMIB的大规模量产,正是在今天的Meteor Lake之上。
刚才我把封装比作了晶元的外包装,但它的核心并不是保护,而在于传输。以EMIB为例,它可将两个DIE通过极高连接密度(55微米间距)的底层引线在基板上实现互连,从而集中在一个封装之中;而Foveros则实现了DIE和DIE之间的叠加,以更高连接密度实现了DIE与DIE间,再透到基板上的连接。以在Lakefield为例,它实现了50微米间距的连接,从而将芯片尺寸做到了12mm×12mm。
看到这里你应该就能理解,更好的封装技术能够在芯片层级带来更低功耗和高密度的芯片连接,最小化分区间的开销。特别是3D封装技术,能够在芯片中构建出更小的DIE,这样可以按它实现的功能集去建立一个个的Tile(小芯片),而不同功能集的Tile又可以采用最适合的芯片工艺【也就是说,以后我们所说的处理器工艺制程,更准确地是指计算模块(Compute Tile)采用的工艺制程、GPU、IO等模块可以根据需求采用其他的工艺制程】,它们组合在一起构成一个功能更加强大、计算规模更大的处理器,而且同时也能带来更好的经济性。
以英特尔标准晶圆上现在常切割的100平方毫米芯片为例,如果采用小Tile的3D封装工艺,便可切割为50平方毫米的芯片,从而获得额外10%的芯片。另外,切割较小区块的芯片,同时还能提升晶圆良率。另外,从Tile层面按需定制的方案更加适合英特尔的IDM 2.0策略,面向订制客户不仅可以在封装中放入英特尔自己的Tile,也可以放入第三方的Tile。
指导英特尔封装工艺的进步,同样离不开我们耳熟能详的一位英特尔名人——戈登•摩尔。他不仅提出了摩尔定律,另外还说过:“在构建大系统时,将其分解为单独封装并互连的较小功能模块可能更经济。”要知道,摩尔在数十年前仅凭当时的技术水准就准确地预测了今天最新封装技术的发展趋势,让我们不禁猜测这位开创英特尔的技术奠基人是否是穿越者。
3D封装可带来更好的良品率和经济性
刚才我提及:“切割较小区块的芯片,同时还能提升晶圆良率”,原理就就要从3D封装制造流程谈起。英特尔在拿到晶圆后会将其切割为DIE,经过测试后再将DIE与DIE间,并且穿透在基板之上进行连接,也就是3D封装;封装之后再进行二次分割,并按照处理器需求规格进行封装并完成系统级测试。
可以看到,每个分割下来的晶片小区块(Tile)只有通过测试才会进入到Foveros封装,从一开始就为最后的系统级测试打好基础。
另外,英特尔用于全自动、全流程、共址Foveros晶元厂拥有行业领先水准,而且拥有高速高良率的晶圆级组装工艺,进一步提升流程中的良品率。
具体在Meteor Lake之上,可以看到组成整个芯片的共有四个模块(Tile),分别是计算模块(Compute Tile)、图形模块(GPU Tile)、IO模块(IO Tile)和创新的SoC模块(SoC Tile);然后,通过Foveros封装解决Top DIE和Base DIE的堆叠,再通过EMIB将各个功能模块,甚至是内存芯片(HBM)封装在一起,这就是刚才提及的Co-EMIB。
解读分离式模块架构的设计思路
是的,以往各个厂商发布新一代的处理器,很少会谈及构架设计设计,但是,Meteor Lake的分离式模块构架的变化真太大了,值得大家去深度了解芯片构架设计工程师的思路。
其实在讲完封装之后,大家应该初步获知了Meteor Lake的4大模块。先给大家看一张Meteor Lake的芯片结构图,由上至下、由左至右分别是GPU Tile、SoC Tile、IO Tile和Compute Tile,大家觉得是不是很像我们小时候玩过的“华容道”或者积木玩具?的确,Meteor Lake正是像搭积木一样“堆叠”的分离式模块架构。
在解读构架之前,我们再来看这4个独特模块的主要功能和新升级的亮点,一会再给大家逐个解读不同模块的具体设计:
-
计算模块(Compute Tile):采用了最新一代的能效核和性能核微架构以及增强的功能。该模块采用新一代的Intel 4制程工艺,在能耗比方面实现了重大进步。
-
SoC模块(SoC Tile):创新的低功耗岛设计,集成了神经网络处理单元。(NPU),为PC带来了高能效的 AI 功能表现,并兼容OpenVINO等标准化程序接口,便于AI的开发及应用普及。新的低功耗能效核,进一步优化节能与性能间的平衡。SoC模块还集成了内存控制器、媒体编解码处理和显示单元,支持 8K HDR和AV1编解码器以及HDMI 2.1和Display Port 2.1标准。还支持Wi-Fi 和Bluetooth,包括Wi-Fi 6E。
-
图形模块(GPU Tile):这款处理器集成了英特尔锐炫™ 图形架构,能够在集成显卡中提供独立显卡级别的性能,支持光线追踪和Intel XeSS。凭借图形功能的跃升和更高的能效表现,Meteor Lake能够提供出色的每瓦性能表现。
-
IO模块(IO Tile):包含业界出众的连接性,集成了Thunderbolt 4和PCIe Gen 5.0。
在Compute Tile上,Meteor Lake引入了全新的性能核和能效核微架构,分别命名为Redwood Cove和Crestmont,全新的命名意味着它们在Intel 4制造工艺的基础上在性能上获得了提升,具体参数需要等产品正式上市才能获知。
SOC Tile是Meteor Lake上首次出现的功能模块,它的设计出发点在于实现更低的功耗,所以为其添加了一个全新的低功率计算岛能效核(LP E-Core),之所以要将它放在SOC Tile中,是因为在日常唤醒SOC Tile中媒体、显示等IP时同样也需要计算单元来控制和协调,这时Compute Tile的算力在能效上就非常不经济,在SOC Tile中专门设置这样一样能功率计算核心为之服务能够大大降低能耗和提升效率。
正是LP E-Core的加入,让Meteor Lake拥有了一个三阶的高性能混合架构,从而使其拥有更好的线程调度,以及更好的性能和功耗的平衡。这样的构架设计,是不是有点像智能手机芯片上的小核、大核和超大核的概念?相信不久的未来,各种场景下使用的计算芯片中根据不同功能和功耗需求设计的多阶混合构架也会越来越多。
另外,首次出现在CPU中的神经网络处理单元NPU也集成在SOC Tile之中,这也是英特尔CPU中首次出现专门为AI服务的智能加速引擎。关注我的朋友相信也关注到我之前专门披露过NPU的性能和特点,作为CPU中的一个功能模块,它可以提供比CPU和GPU低的功耗,而且性能比英特尔之前推出的Muvidios神经计算棒性能更加强大,不仅可以实现判定式AI应用,也能应对当前流行的生成式AI应用。
除了以上提及的两个IP,英特尔还将以往放在集成显卡中的媒体处理计算单元、编解码器独立出来,放到了SOC Tile之中,再加上一些常规的连接模块,比如支持Wi-Fi 7(兼容Wi-Fi 6E)的模块、显示输出单元以及内存控制器等低功耗的模块均集成其中,让整个SOC Tile自身就成为一个功能性的“MINI CPU”。
Meteor Lake的GPU Tile,同样启动了全新的3D高性能混合架构。英特尔是最早在CPU中集成核芯显卡的厂商,其集显也从9代图形引擎到11代图形引擎,到新的Meteor Lake,都实现了翻倍的3D计算性能的提升。
我们还可看到,Meteor Laker的核心显卡不仅拥有在集成显卡领域的积累,还全面采用了锐炫独立显卡构架,全新显卡不仅能够更好地支持DX12Ultimate的功能集,同样具备光线追踪和XeSS功能。
在IO Tile上,英特尔同样引入了众多的IP,包含跟PCIe Gen 5以及Thunderbolt 4进行连接的模块。不仅如此,英特尔还高带宽、快速响应的NOC总线之外提供了一根IO fabric总线,将IO Tile中的PCIe、USB-4、Thunderbolt 4以及SOC Tile中的Sensing、Audio、Ethernet、Wi-Fi等IP都挂载在上面,提供专门的数据通道,这大大减轻了为计算单元服务的NOC总线的压力。所以可以期待Meteor Laker提供的平台扩展能力将拥有更大的潜力。
从总体设计目标来看,Meteor Lake需要引领PC处理器的性能功耗效率,也就是每W性能比,并且加入人工智能加速引擎NPU,并且实现集显性能的跃升,相信这也是关注英特尔处理器的朋友们非常关注的,并且在升级Intel 4制造工艺后通过分离式模块架构提从更加全面的功能表现。
没有结束的结语:
在介绍英特尔的封装技术和Meteor Lake的分离式模块架构的设计思路之后,我突然发现,这篇关于Meteor Lake已经很长了,但即使如此,我们依旧没有开始详细解读四大模块和全新引入的NPU的性能特点。所以我不打算在这个结语中说任何结论性的东西,接下来的内容会放下期《Meteor Lake四大模块与AI功能详细解读》之上。
加载更多