骁龙8至尊版2曝光, 但最有看点的地方并不是跑分

虽然距离正式发布大概还有一个多月，但疑似骁龙8至尊版2（SM8850）的跑分成绩已经在GeekBench的服务器上出现。

此次曝光的信息来自一台三星“SM-S947U”手机，所对应的可能是Galaxy S26 Edge。从跑分来看，它在GeekBench 6.4中获得了单核3393分、多核11515分的成绩。

如果大家有关注我们三易生活的评测内容，那么对于这样的成绩就可能不会感到太过惊奇。毕竟，这只比现款骁龙8至尊版的典型跑分水准（单核3000上下，多核10000上下），高出了大概10%而已。

那么这是否意味着，骁龙8至尊版2的CPU性能进步幅度不大呢？并不尽然。一方面，根据更进一步的信息来看，这台三星手机在整个跑分过程中，CPU的峰值频率只达到了4GHz，而不是“满血”的4.74GHz。这就表明它要么是遇到了过热节流问题，要么干脆就不是正式版的芯片或固件，所以频率就“没上去”，并不能代表骁龙8至尊版2的真实峰值性能。

但这次曝光的信息中真正让我们感到“触动”的，压根就不是骁龙8至尊版2的跑分数字本身，而是GeekBench除了性能测试之外，所“探测”的到其他东西。

从128位到2048位，骁龙新旗舰多了“超算血统”

我们先将视线集中在此次曝光的跑分截屏下方区域，在这里GeekBench列出了它所识别到的，骁龙8至尊版2所支持的一系列指令集信息。

从中可以清楚地看到，骁龙8至尊版2除了支持“古老的”neon指令集外，还支持sve和sme2这两个新得多的指令集。

这是什么概念呢？通过查询公开信息可知，neon指令集诞生于ARM v7时代，最早见于2005年的Cortex-A8架构，它最大支持128bit（位）的向量计算字长。

而sve和sme2则要“先进”得多，它们分别诞生于2016年和2021年，最初都是由超级计算机的CPU首发，用于AI训练等繁重的工作。所以这两个指令集最先进的地方，就在于它们都可以支持到最大2048bit的超大规模字长，甚至超过了目前x86服务器CPU所支持的512bit AVX指令。在它们被“移植”到移动平台后，这一关键技术特性也并没有被“阉割”。

当然，这并不是说高通给骁龙8至尊版2增加这两个新的指令集，就一定与超算有关（虽然他们确实可能有借助Oryon架构重回超算市场的打算）。

它们真正的意义在于，一方面sve和sme2作为ARM IP体系下最新的、旨在增强处理器浮点性能的指令集，相比于古老的neon，能够大幅增强现代ARM处理器在面对复杂多媒体任务的性能表现。说人话，就是能增强游戏、视频编辑等场景的CPU效率。而且这两个指令集在超算上本就是为AI而生，所以“移植”到移动端后，对增强CPU的AI计算能力自然就意义不小。

最新版的Intel指令集文档显示，AVX10.2将强制大小核全部支持512bit计算能力

另一方面，关注PC行业的朋友可能知道，目前消费级x86 CPU普遍支持256bit加速运算的AVX2指令集。最快到2026年，英特尔就会在NovaLake-S平台加入AVX10.2指令集，实现全部核心的512bit加速运算功能。

而现阶段的高通Oryon架构，因为只支持最大128bit的neon指令集，就导致其在PC平台（也就是骁龙X系列）上运行需要AVX2（256bit指令集）的程序时，效率大受影响。因此当骁龙8至尊版2加上最大能够实现2048bit向量计算的这两个新指令集后，就让我们会对大概率也将采用新架构的下一代骁龙X PC平台的性能、以及x86转译的兼容性，有了更高的期望。

下一代是变强了，可这一代反而成为了“奇迹”

如果大家以为，我们仅仅就只是因为骁龙8至尊版2引入了新指令集，可能会带来巨大的浮点性能改进而感到兴奋，就未免把事情想得太过简单了。

首先，大家都知道骁龙8至尊版是基于ARM v8.7 IP的架构设计，这意味着它在最底层的指令集上，要落后于苹果A18 Pro、联发科天玑9400、小米玄戒O1等竞争对手。因为后者全都是基于ARM v9.2的架构方案，从“根子上”来说，确实要比现在的骁龙8至尊版更先进。

苹果A18 Pro，ARM v9.2，有sve、也有sme2

联发科天玑9400，ARM v9.2 ，有sve、无sme2

小米玄戒O1，ARM v9.2，有sve、无sme2

那么这是否意味着，上述的这几款ARM V9.2的处理器，早就已经能支持sve、sme2这些先进指令集了呢？我们同样找来了它们的GeekBench跑分信息。可以看到，其中只有A18 Pro确实早早就内置了sve和sme2，而联发科和小米的ARM V9.2方案，就都只有sve，并未配备sme2指令集。

从ARM的商业模式来说，哪怕大家都是v9.2代次的架构，具体内置哪些指令集其实也是“可选”的。所以苹果敢于早早地实装先进的浮点加速指令集，很大程度上是因为他们有封闭生态，所以有信心可以“督促”开发者尽可能积极地对新架构、新指令集做适配。

而其他家的ARM v9.2方案不选择sme2，显然也不只是为了节约成本，而是多少有考虑到这一先进指令集在目前的安卓生态里还过于小众，即便硬件上了，也不一定能够促使开发者去主动进行适配。

但大家要知道，与它们同期的骁龙8至尊版，别说是没有sme2（因为它是与ARM v9绑定，基于v8.7的Oryon自然就不可能有），就连sve指令集也并没有配备。

换句话说，如果高通的竞争对手真能在2024年底到2025年秋季的这段时间，充分地宣传“使用ARM v9 CPU的好处”，并敦促那些游戏和大型APP开发者使用sve指令集，其实他们原本是有可能在性能上充分发挥出代次优势的。

可结果呢？大家都知道，无论是在本就支持sve、sme2的跑分软件里，还是在各主流游戏和生产力应用中，在上述这段时间里的那些、本来架构更先进的竞争对手，结果却并没有一个能够真正在“实际性能”上超越骁龙8至尊版。换句话说，也就是高通用了一个相对落后的底层设计，却做出了更好的实际表现。

要知道从以往的经验来看，这可不是一件容易的事情。比如早年间的英特尔Monahans（即PXA310）、英伟达Tegra2，甚至包括高通自己的双核版本Scorpion（MSM8260），都曾因为底层的指令集、架构缺憾，在市场宣发和“钱景”上遭遇了设计更完善竞争对手的“强烈冲击”。可到了骁龙8至尊版这里，却完全颠覆了“落后（架构）必然挨打”的常识，硬生生地用较老的底层设计，打翻了一票明明更先进的竞争对手。

优势不只取决于硬件，骁龙的表现再次证明了这一点

那么，骁龙8至尊版到底是怎么做到这种“反杀”的呢？

从硬件设计层面来说，大家都知道骁龙8至尊版与同期的竞品相比有两个明显特征，一是主频要高得多，二是去掉了L3和SLC缓存，用超大的、带宽更高的L2缓存取而代之。也就是说，高通当时的Oryon架构或许在底层指令集上“有点老”，但他们确实用了更高的成本，在硬件规模上堆出了当时“公版ARM架构”实现不了的超高主频和超大缓存。

相比之下，无论是同期的苹果和联发科，还是后来的小米，首先在处理器的部分单元设计上确实都呈现出逊色于高通的水准，至少它们都没能搞定那么恐怖的主频。

从部分平台明明用了ARM v9.2指令集，却“不愿意”实装sme2这个现象来看，所反映出的也不只是相关厂商想要节约成本这么简单。因为这实际上也体现出，它们对于说服开发者“抛弃”高通、专为自己做优化可能还缺乏信心。

其实这也很好理解。毕竟我们不久前在《高通攒了个“游戏生态”的局，再次秀出技术优势》中，报道过他们今年的“骁龙游戏技术赏”。在此次活动中，比起高通的代表，来自各大手机厂商、游戏引擎平台、游戏开发者方面的登台时间显然要长得多。从这些合作伙伴对于骁龙8至尊版硬件性能、开发工具，以及性能优化套件的盛赞来看，高通如今所取得的成绩，显然不仅仅是来自于硬件设计或者分优势那么简单。

而这也就很直接地提醒了目前所有的芯片厂商，比起单纯地追求硬件规格、架构方面的领先，生态和软件建设在很多时候也能对市场表现起到关键性的作用。当然，如果在这个基础上，硬件还能做到足够强大，那自然也就更加“无敌”了。

【本文部分图片来自网络】