本文来自

《微型计算机》

2016年20期

《微型计算机》领导数码时尚新生活,坚持以人为本,把消费类电子产品的广泛应用与现代生活紧密结合,以通信、娱乐、移动、影像为四大基本报道方向,向读者提供最快、最新的数码产品资讯和最适用的数字消费指南,引导最精彩的数字时尚生活。

购买纸刊
写了 5 篇文章,被 0 人关注,获得了 0 个喜欢

英伟达的汽车“芯”

解析Tegra Parker

文/ 张平
评测
前言 英伟达的Tegra系列由于没有基带支持、本身功耗控制以及市场导向等问题,在手机发展上折戟,同时也随着平板市场的萎缩而渐渐销声匿迹。目前,采用Tegra芯片的产品除了英伟达自家的平板电脑外,就只有谷歌、微软、惠普等厂商部分产品了,并且看起来都并非主力销售的款型。不过在汽车智能化市场,Tegra产品却打出了一片天地,英伟达不但推出了Driver CX系列数字化座舱外,还推出了专门面向自动驾驶的Driver PX系列产品,这两者的核心都是Tegra处理器。2016年8月,英伟达又发布了全新的Tegra Parker,这一次,又有什么新的技术出现呢?

英伟达在之前的路线图中出现过Tegra Parker的身影,相比最终发布的产品变动还是相当大的,比如GPU部分就升级为了Pascal,CPU部分也不只是Denver。

        英伟达最近股价飙升,其中很重要的一个原因是英伟达在很早之前就布局了车载市场,尤其是自动驾驶市场。在自动驾驶技术上,眼前比较流行的实现路径之一就是汽车通过搭载各种摄像头、雷达、红外线等探测器采集图像数据,再将这些信息通过中央处理系统的深度学习算法进行处理和分析,最后发出指令来控制汽车并实现自动驾驶。在这个过程中,深度学习算法所需要的并行计算能力就显得颇为重要,而GPU在这方面有天生的优势,高度并行、海量规模的架构能很好的满足深度学习的需求。
        在之前的发布会上,英伟达在展示全新一代的Driver PX2时,就曾提到这款自动驾驶处理平台搭载了两颗全新的Tegra处理器和全新一代Pascal架构的GPU,整机的深度学习能力高达24DL TOPS(Deep Learning-Tera-Operations Per Second,DL TOPS,深度学习每秒计算兆次),远超前代产品。其中Pascal架构的GPU自然是重头戏,不过两颗全新的Tegra处理器也不可小觑。不过当时英伟达并没有公布太多这两颗处理器的信息,直到2016年8月,英伟达终于正式发布了这款Tegra处理器,名字出乎意料,被称为全新的Tegra Parker。

“2+4+256”—超强规格,令人震撼
        按照惯例,我们还是首先来看Tegra Parker的规格。
        和之前的Tegra X1、Tegra K1 A15版本完全不同的是,在Tegra Parker拥有6个CPU核心,且英伟达自有的Denver系列架构又出现了,还升级到了Denver 2。宏观上来看,Tegra Parker的CPU部分有两个簇,其中一个簇中包含了2颗Denver 2架构的CPU核心,另一个簇中包含了4颗Cortex-A57架构的核心,两个簇之间通过缓存后再使用HMP总线互联并保证缓存一致性。
        在缓存方面,Tegra Parker的2个Denver 2核心和4个Cortex-A57核心分别配备了2MB的L2缓存,然后双方的L2缓存再通过一致性单元连接在一起。L1缓存方面有点复杂,Denver 2和之前的Denver一样,使用了128KB指令缓存搭配64KB数据缓存;而Cortex-A57则是48KB指令缓存搭配32KB数据缓存,从缓存容量的差别上就能看出双方架构设计存在巨大差异。内存方面则支持LPDDR4内存,带宽为50GB/s,支持ECC校验,相比上代产品大幅度提升。
在GPU方面,之前的Tegra X1使用的是Maxwell架构,集成了256个CUDA Core,性能即使放在现在也是首屈一指的。在Tegra Parker上,GPU的架构则采用了更先进的Pascal,CUDA Core数量还是256个,性能功耗比进一步提升。
        不过,和上次发布Tegra K1英伟达详细公布了Denver架构信息不同的是,本次英伟达几乎没有给出任何有关Denver 2架构的信息,也没有说明新的架构在何处进行了升级。只是简略提到了Denver 2依旧是7-way的超标量架构、支持乱系执行、每瓦特性能非常优秀、支持低功耗模式等。有关Denver 2的内容,还需要等待随后更多资料流出才能明确。
        工艺方面,Tegra Parker升级到了TSMC 16nm FinFET工艺,作为全代次,又加入了FinFET技术的新工艺,Tegra Parker在晶体管密度、电压等方面肯定要比之前半代工艺TSMC 20nm要强很多。
        说完了Denver 2,再来看看核心的搭配问题。这次Tegra Parker的CPU部分采用的是“2+4”的模式,一般来说,如果采用ARM的big.LITTLE架构的话,应该是“高性能核心+节能核心”的模式,但是Tegra Parker却是“Big+Super”也就是“高性能核心+超高性能核心”的模式,这样一来,Tegra Parker面向的市场基本就放弃了手机,缺乏节能核心的它不太适合在小尺寸设备内存在,甚至平板上使用Tegra Parker可能也会存在散热问题。不过,Tegra Parker面向的市场应该就是车载和大尺寸设备,并不用太担心功耗问题,这样的搭配反而能取得最好的性能。
        另外,Tegra Parker中还有一些问题需要考虑:比如为什么使用两颗Denver 2搭配四颗Cortex-A57而不是四颗(甚至六颗)Denver 2?为什么不是六核心Cortex-A57(或者Cortex-A72)?对此英伟达做出了一些解释。比如自动驾驶需要更强大的单核心性能、无论是自动驾驶还是游戏都需要更多的核心、总性能需要进一步提升等。而且为了满足这六颗核心高效率运作,英伟达还设计了多项辅助技术,其中自动排序技术可以让Task能够自动排序运行在正确的CPU核心上、当计算需要改变时可以自动移动Task或者线程去正确的核心、在不同的核心簇之间移动任务时保证缓存一致性等。
        当然,有一种猜测是可能在汽车自动驾驶的应用场景中,需要单线程性能强悍的核心来对某些事项实现高效率的处理,性能要求较低但并行性要求较高的事项可能会交给四颗Cortex-A57来充分发挥,这也是比较实际的设计方案。无论如何,Tegra Parker中还存在大量可以猜测的地方,还需要英伟达在未来公布更详细的内容(当然可能永远也不会公布)。

为自动驾驶优化—Tegra Parker的功能性设计
        除了核心设计外,还有一些功能性的内容。比如在存储方面,Tegra Parker支持eMMC 5.2,SATA接口,比前代规格更进一步。视频方面支持2160p的60Hz编解码,之前的处理器都只能支持2160p@30Hz编码,Tegra Parker的视频功能更为强大了。摄像头方面,Tegra Parker支持12路HDR摄像头,也远胜前代产品。
        在人们特别关注的自动驾驶方面,Tegra Parker支持最新的以太网音视频桥接技术(Ethernet Audio/Video Bridging),这是一项新的IEEE 802技术,主要目的在于建立高质量、低延迟、时间同步的音视频以太网络,实现实时音视频流的传输,这在自动驾驶上能够提供同步的音视频数据,提高安全性。此外,Tegra Parker还提供了Dual CAN和QSPI的支持,其中CAN是控制器局域网络(Controller Area Network, CAN)的简称,是博世推出的现场总线标准,已经成为了ISO 11898国际标准。CAN总线主要优点在于结构简单、各节点可以自由通信、节点数量理论上不限制等,在汽车上有重要应用。Tegra Parker支持双CAN接口。QSPI则是Queued SPI的简写,属于SPI接口的扩展,属于一种高效的传输接口,多见于工业设备和汽车等场合。

 

TIPS:有关Denver架构的一些背景知识

        说起Denver 2,就不能提及Denver。Denver是英伟达在2014年发布的自研CPU架构及产品,这也是英伟达首次以自主研发的姿态进入CPU市场。在Denver上,英伟达采用了完全不同于ARM公版架构的设计,其类似全美达的VLIW超长指令集架构、支持OOO乱序执行。Denver的7-way的超标量管线很少见(目前的主流处理器一般不会超过3-way,当然这两类处理器的实现方式不同,不能通过管线数量宽度来比较性能),L1缓存为4-way,128KB指令缓存搭配64KB数据缓存,16-way的2MB L2缓存。Denver的频率非常高,一般可达2.3GHz到2.5GHz。从性能测试来看,Denver的表现非常不错,它的性能特点在于注重单线程性能,甚至可以媲美“单线程性能之王”苹果A系列处理器,比如在大部分综合测试中,单核心性能部分Denver核心的Tegra K1处理器的都和苹果A8X处理器基本持平。
        2016年下半年,苹果A10处理器又将移动SoC的性能推向了另一个高峰,而Denver却一直没有消息,随后的Tegra X1也是采用的ARM的Cortex-A57核心。Denver以及其后续产品的发展,一直是业内关注的重点。要知道,英伟达之前研发Denver耗费了五年时间、数百名顶级工程师,这样庞大的遗产不可能说没就没。这次Denver 2的发布,很好的回答了这个问题。当然,Denver 2的性能究竟如何,目前还没有太多资料,也只有等待未来进一步测试才能得知。

英伟达CEO黄仁勋手持Driver PX2,宣布Tegra Parker的发布。

Tegra Parker的核心结构简图

Tegra Parker对比上两代产品,进步巨大。

Driver PX2使用了2个Tegra Parker处理器

Tegra Parker的处理器部分结构简图

Denver架构简图

Tegra Parker上对CPU部分做出的一些特殊设计

TIps :有关Denver架构的一些背景知识

        说起Denver 2,就不能提及Denver。Denver是英伟达在2014年发布的自研CPU架构及产品,这也是英伟达首次以自主研发的姿态进入CPU市场。在Denver上,英伟达采用了完全不同于ARM公版架构的设计,其类似全美达的VLIW超长指令集架构、支持OOO乱序执行。Denver的7-way的超标量管线很少见(目前的主流处理器一般不会超过3-way,当然这两类处理器的实现方式不同,不能通过管线数量宽度来比较性能),L1缓存为4-way,128KB指令缓存搭配64KB数据缓存,16-way的2MB L2缓存。Denver的频率非常高,一般可达2.3GHz到2.5GHz。从性能测试来看,Denver的表现非常不错,它的性能特点在于注重单线程性能,甚至可以媲美“单线程性能之王”苹果A系列处理器,比如在大部分综合测试中,单核心性能部分Denver核心的Tegra K1处理器的都和苹果A8X处理器基本持平。
        2016年下半年,苹果A10处理器又将移动SoC的性能推向了另一个高峰,而Denver却一直没有消息,随后的Tegra X1也是采用的ARM的Cortex-A57核心。Denver以及其后续产品的发展,一直是业内关注的重点。要知道,英伟达之前研发Denver耗费了五年时间、数百名顶级工程师,这样庞大的遗产不可能说没就没。这次Denver 2的发布,很好的回答了这个问题。当然,Denver 2的性能究竟如何,目前还没有太多资料,也只有等待未来进一步测试才能得知。

       在安全方面,Tegra Parker支持Automotive Rated SoC,更宽泛的适应性设计、片上安全管理等技术,这些技术都是全新加入,之前的产品均不具备。虚拟化方面,Tegra Parker也支持最多8路硬件虚拟化,以便支持更多虚拟用户的使用。

性能—英伟达说它打遍天下无敌手
        规格基本看完后,再来看看性能。目前由于不存在Tegra Parker的相关设备,因此性能都来自于英伟达的官方内容。在偏重整数性能的SpecInt2K测试中,如果Tegra Parker的性能是1的话,那么苹果A9X最多只有0.6,华为的麒麟950也是0.6,三星Exynos 8890略低,高通的骁龙820大约只有0.4左右。英伟达宣称Tegra Parker的处理器性能比A9X等处理器最多提升67%,比骁龙820提升高达150%。
        除了处理器性能外,有关Tegra Parker的功耗、GPU性能方面基本就没有任何信息了。对于GPU性能,考虑英伟达目前在GPU届的地位以及Pascal架构GPU出众的表现,Tegra Parker应该是目前所有ARM SoC中顶尖的选择,这一点不会有太多疑问。功耗方面,从架构设计来看,Tegra Parker的功耗肯定不会太低,我们大胆猜测其在最极端情况下有可能会达到15W~20W左右。这样猜测的原因是,之前Tegra X1的功耗最高可能在15W附近,Tegra Parker与其类似,但是加入了2个Denver 2核心,即使制程改换,但是晶体管数量变多、频率提升的话,功耗也会持续上升,况且Tegra Parker的应用场景早都不是狭窄的手机和平板,提升功耗换取更高的频率和性能也完全说得过去。当然,英伟达如果考虑将Tegra Parker集成在SHILED游戏机中的话,应该会在功耗控制、频率控制上有另外的方案,功耗也可能会大幅度降低,甚至低于10W也是有可能的。

写在最后
        总的来看,Tegra Parker的规格相当令人震撼,完全是以面向较高性能场合而设计的处理器,虽然其性能和英特尔、AMD的高端X86处理器无法相媲美,但是在诸如车载、娱乐等场合还是相当适用的。况且从这次Tegra Parker发布神神秘秘、遮遮掩掩,而且没有移动终端参与,只有自家的Driver PX2来看,这次英伟达是铁了心杀入汽车市场,准备彻底投入了这个庞大的蓝海,誓不回头了。Tegra Parker和英伟达的自动驾驶技术一起,带给英伟达的不光是股价飙升、也不光是汽车市场,而有可能是未来十年发展的根基。
        不仅如此,从Tegra Parker的发布、以及英伟达现在官网都没有Tegra Parker的介绍等迹象可以看出,Tegra这个品牌有可能在未来会离普通消费者越来越远。因为没有大量移动终端的加持、全身心进入汽车市场的话,消费者将逐渐淡忘这个品牌。对全新的汽车用户来说,根本没必要去了解汽车用的谁家的处理器—最多只有极客在购车时会考虑自动驾驶模块来自于哪家。汽车消费者更关心车的排量、速度、储物空间容量、外观甚至是否油电混动,而不会在乎小小的Tegra Parker。一个品牌的逐渐隐退,换来的可能是一个千亿级的巨大市场,英伟达的闷声大发财之路,才刚刚开始呢。

Tegra Parker支持虚拟化技术

英伟达给出的Tegra Parker性能,只有CPU部分,测试条件不是很明确。

Tegra Parker的特性一览

Driver PX2上的Tegra Parker

登录注册 后评论。
n
Copyright © 2016 vantk.com 远望资讯 版权声明. 经营许可证:渝B2-20030004-10

渝公网安备 50019002500898号