austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

虽然目前智能手机和平板之类的设备已经对极致性能没有了太多的诉求,但VR又成了下一个着力点,近日ARM就在Computex 2016上公布了可以说是为VR设备的沉浸式体验准备的Cortex-A73新架构,均对VR的性能和显示需求做好了准备。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

功耗优化多过性能 ARM Cortex-A73解析

回顾一下前任A72,作为big.LITTLE架构里的大核在今年的主流市场得到了广泛应用,骁龙650里有两个,骁龙652里有四个,麒麟950/955里有四个,联发科Helio X20/X25里有两个,当然考虑到各自的不同定位,工作频率及制程工艺上的选择都各有不同;从产品分布可以看出,今年的Cortex-A72并不如前任Cortex-A57那样在高端市场吃香(骁龙810、Exynos 7420),三星用了半自主架构,而高通则彻底回到自主架构。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

A9~A73发展历史回顾

抛开那颗著名的寿命极长、高能效比的Cortex-A7不说,Cortex-A9是对于ARM来说极为重要的里程碑,采用该架构的平台——诸如苹果A5、三星Exynos 4210/4412、德仪OMAP 4430/4460都证明了A9的成功。

之后便是毁誉参半的Cortex-A15,性能相比之前突飞猛进的同时带来了不小的功耗和发热问题,比如Exynos 5250/5410都受其影响,再想想当年的核弹Tegra 4什么的……

而看到这一问题的ARM也在随后推出了著名的big.LITTLE架构,随之诞生了全球首款真八核Exynos 5422,以及麒麟920等平台。

随着Cortex-A57的登场,ARM阵营正式迈入ARMv8 64位指令集时代,当然这也是苹果A7的功劳,与Cortex-A53结合的大小核架构成为了随后的主流,其中出现了4大4小、2大4小、不同频率的两组4小各种组合方式,并流传至今;其中有人欢喜有人愁,三星靠Exynos 7420成功夺得眼球,而骁龙810则因为发热问题成为了一代尴尬的旗舰。

在这些主流微架构之外,还有2013年7月公布的Cortex-A12以及2014年2月公布的Cortex-A17,短命和不受待见没让其成为主流,只有MT6595这样极少的平台采用。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

A17家族而非A72升级

而此次的A73并非是简单的A72升级,这还要从ARM的家族划分说起,A15、A57、A72属于Austin家族(来源于ARM位于美国德州奥斯汀的设计中心),而A5、A7、A53则属于Cambridge家族(名字来源于ARM总部英国剑桥),A12、A17以及刚刚公布的A73属于Sophia家族(名字来源于欧洲最大科技园区索菲亚,也就是ARM法国CPU设计中心所在地)。

虽然命名上Cortex-A73看似是A72的升级,但是从技术层面讲,它其实是A17的进化版本,整体微架构、流水线、宽度设计都与之类似,反而和A72差别很大,并且,A73也没有保留A72的三发射,而是采用了与之前的Sophia家族微架构相同的双发射。而ARM此次的宣传显然也是侧重能效而非性能,对于前两代动辄5W甚至10W的峰值功耗来说,ARM期待Cortex-A73能够长效的保持高性能,而不是因为短暂高频运行后发热降频,换句话说,要持久…

对比一下A73与A72的流水线图,你就能发现设计思路上的显著不同。Cortex-A72采用了15级以上的乱序流水线设计、128位预取指令、3发射解码、每个时钟周期分配最多5个微操作、满足最多7个发射队列进入8个执行流水线。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

而A73的设计颇似A17,流水线深度较A72有所减少,预取阶段从A72的5级减少为4级,进入浮点流水线的微操作还经过一个额外的取指阶段,整个流水线只有11~12级。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

由此可以看出A73的设计基于跟A17相同的逻辑,通过优化流水线、资源和接口来在可实现的最小功耗水平上获取最高的性能。ARM也表示他们还特别进行了32位/64位状态下的平衡优化。

性能提升上,ARM表示A73在所有重要的移动应用上都具备超越A72的性能表现,不过给出的对比倒是不多,比如BBench网页载入测试性能相比A72提升10%,FFMEG解码多媒体性能提升5%,内存存取性能提升15%。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

而更被看重的性能方面,整数应用当中A73有25%的功耗降低,浮点和二级缓存应用当中有30%左右的降低,ARM也表示在相同的频率下,A73整体相对于A72有着20%的功耗降低。

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

austin\x20rivers(功耗优化多过性能 ARM Cortex-A73解析)

10nm制程让A73的尺寸在相同性能下比A72小25%,因此双核A73的尺寸基本跟四核A53相同,特别是在如今众多采用4 4 A53设计的处理器性能表现并不抢眼的情况下,这一组合有望被2xA73 4xA53的设计替代,在核数减少单线程性能大幅提升的同时保持相同的芯片面积。