AI助手内卷加剧，但你的下一部手机何必是手机

原文来源：量子位

图片来源：由无界 AI生成

谁能想到，大模型风暴袭来，钢铁侠里的贾维斯俨然成了最忙碌的“漫威英雄”（手动狗头）。

原因无他，实在是超级助手这个概念太火爆，从手机到PC再到智能座舱，哪里都要被cue上一轮。

甚至连硬件本身的形态，都因此出现了新的变化。

比如火爆国内外社交媒体的AI Pin，就充分展示了什么叫“你的下一个手机，何必是手机”。

这么一个类似徽章的小玩意儿，由高通芯片驱动，内置以大模型技术为基础的智能语音助手。

即使没有屏幕和按键，依靠诸多传感器和智能“大脑”，它一样可以帮你完成打电话、写短信、发邮件、记录世界的操作。

目前，AI Pin背后的公司Humane已经拿下2.3亿美元融资，最新估值达到8.5亿美元。

事实上，无论是挤占各大手机厂商发布会最重要版面的大模型智能助手，还是AI Pin这样更彻底的硬件创新，如果我们透过现象去分析本质，就会发现，核心的变化还是：

随着大模型和AIGC技术的火爆，交互方式变革的序幕，已经被不可逆转地拉开。

而第一波创新机遇，正在智能终端上有所体现。

AIGC时代，交互方式变了

尽管距离真正的“贾维斯”还有不小的距离，但对于智能终端行业而言，在大模型技术的冲击之下，交互方式已经发生了两重变化：

第一重，是人与机器之间交互方式的改变；第二重，则体现在机器与机器的相互联通之上。

人机交互方式变革，在ChatGPT掀起风暴之初，就受到科技界的广泛关注。

原因很简单：从命令行，到GUI（图形用户界面），再到纯自然语言交互，最新科技的使用门槛越来越低的同时，也意味着一切应用乃至设备，都将迎来重构。

而正如移动互联网催生了如抖音这样的现象级App，“重构”背后，新的跨时代杀手级App，甚至是杀手级设备的涌现，开始成为可能。

观察行业动向，不难发现对于场上玩家而言，把握先机已然成为共识。

而最先被看好的超级助手雏形，就是智能语音助手。

像是微软，就直接用大模型驱动的Copilot，取代了Windows系统原有的语音助手Cortana。

更不用提各大手机厂商。大模型/AIGC技术驱动下的智能语音助手，俨然已成各大发布会上的新C位，取代影像成为了智能手机的最新“卷”点。

相较于已然被热烈讨论、实践的人机交互新范式，机器与机器之间交互方式的改变，较少被提及，但实际上，大模型这个“机器大脑”也正在物联网（IoT）中掀起变革风暴。

在过去，受限于物联网场景的碎片化，“一事一议”的模式很大程度上影响了AI算法应用落地的进程和有效性。

换句话说，就是各种终端传感器，缺少一个能真正统筹全局的“大脑”。

而大模型的智能涌现，恰恰填补了这一空缺，能将其他智能终端作为“感官”更好地联动起来。

2023年科技界的另一大热门话题“具身智能”，其实就是大模型与IoT设备碰撞的实例。

△李飞飞团队机器人研究，无需预训练就能让机器人完成复杂指令

人类与机器的交互，机器与机器的互联，大模型时代，“万物互联”无疑有了更具象的进展。

那么，问题来了，要更进一步通往真正的超级助手，并在新的竞争浪潮中取得先机，还有哪些重点信息需要关注？

底层技术加速交互方式变革

任何一项技术的大规模应用，不外乎可以从载体和实现路径两方面来观察。

对于超级助手而言，载体即智能终端，涉及硬件算力和软硬件协同技术；至于实现路径，当下最可能、也最有潜力的技术之一，就是以大模型为代表的AI技术了，而走在这样路径之下的时代，如今我们也称之为「模力时代」。

首先来看智能终端为核心的载体。

横向从终端技术来看，对于超级助手而言，作为载体最关键的衡量标准有两点，计算和连接。

计算，以芯片为代表的各设备的AI计算能力，也是能否承载超级助手的关键。

以当下在智能终端领域占据主导话语权的高通为例。

这几天，高通的端侧运行百亿模型能力又成了热门话题，还被英伟达高级AI科学家Jim Fan转发：

我们正在进入一个新时代。在这个时代，移动芯片的性能不是通过GHz来衡量的，而是通过Llama 2的tokens生成速度来衡量的。大语言模型是新的智能手机操作系统！

这种AI计算能力，具体又可以分为手机和PC两方面。

一方面，以第三代骁龙8移动平台为代表的芯片，正在进一步增强手机计算生成式AI的能力。

如高通AI引擎中最核心的Hexagon NPU，为了更好地支持AI计算，它升级了全新微架构，性能比前代快98%的同时、功耗降低40%，实现了对更多Transformer网络的支持。

加之对高通AI引擎及其他部分，如高通传感器中枢的优化，使得第三代骁龙8移动平台发布时已经实现让终端跑100亿参数大模型，并能以每秒生成20 tokens的速度运行70亿参数大语言模型。

△终端大模型文本生成能力

另一方面，以骁龙X Elite为代表的芯片，又将从手机端卷出来的AI计算能力进一步拓宽，给PC端带来一点小小的AI算力震撼。

骁龙X Elite的高通AI引擎，算力达到75 TOPS。

其中光是核心Hexagon NPU，算力就达到45 TOPS，为此高通特意给NPU增加了全新的供电系统，让它能按照工作负载适配频率；同时，为了专门加速Transformer网络等复杂AI模型，还研发了微切片推理架构。

这样，PC端就能直接运行超过130亿参数的生成式AI模型，写PPT、总结、生成文案甚至无需联网就能实现；

同时AI处理速度快上4.5倍，又能实现视频会议背景虚化、降噪、视频编辑、照片加滤镜等更丝滑的功能。

△视频编辑，一键消除背景无关对象

连接，各设备间传输数据的性能，从底层直接影响超级助手的交互能力。

对于终端设备而言，连接的需求同样有两方面，以手机、PC为代表的人机交互领域，和以物联网为代表的机器万物互联领域。

人机交互领域，需要连接硬件能提供更智能的网络性能分析、同时具备更高的传输效率。

以骁龙X75 5.5G调制解调器及射频系统为例，这款基带首次集成了专用硬件张量加速器，即第二代高通5G AI处理器，AI性能相比第一代提升2.5倍。

基于此，通过分析信号完整性和信噪比，AI就能改善无线带宽、延迟，让网络性能更高效、数据传输更智能。

机器互联领域，对于连接硬件又有续航性能、成本和体积等不同的限制。

以骁龙X35 5G NR-Light调制解调器及射频系统为例，相比移动宽带与极低带宽的NB-IoT，这个基带相当于轻量级实现了5G的传输性能，同时续航也要更持久、成本更低，更好地适应体积更小物联网设备。

但除此之外，还有很关键的一点，即计算和连接之间兼容并济的能力。

无论是云端运行的通用大模型、还是终端以超级助手为目标的个人大模型，要想实现二者并行，势必需要5G+AI技术的双驱动，才能在确保传输数据效率、确保使用体验的同时，保证各侧模型的稳定运行。

高通已经在这条路上走了至少5年。

从定位智能终端设备开始，高通就一直在利用5G技术的连接能力，将更多AI技术由云端扩展至终端，如同渠与水的关系一样，让“原本在数据中心才能实现的AI功能，现在终端也能实现”。

最早从手机的摄影、图像视频处理，到更多设备如汽车智能座舱AI的数据传输、XR上运行手势识别等AI功能需要的低延迟，再到如今在云端和终端运行生成式AI……

高通不断用最新的AI技术快速引领终端侧的功能革新，而这每一步都离不开5G数据传输在背后的连接支持。

正是有了AI+5G打配合的能力，才能在进一步用高效连接提升AI使用体验的同时，反过来用AI增强连接的性能，最终改变用户和终端交互的方式。

纵向从载体类型来看，这种交互方式的变革，又能通过高通AI软件栈这样的工具无缝衔接到不同种类、不同功能的终端设备中。

高通AI软件栈全面支持各种主流AI框架、不同操作系统和编程语言，来提升各类AI软件在智能终端上的兼容性。

基于这套工具包，即使只在一个平台如手机上开发，也能在汽车、XR、PC和物联网上运行，极大加速了交互方式变革的速度。

总结来看，在各类终端万物互联的时代，AI+5G是不可或缺、相互协作的两大最重要的基础能力，而高通恰好在这两个领域都处于领先地位，并持续引领着终端侧的技术发展。

但对于超级助手而言，智能终端核心技术发展再快，也只是作为载体，为其大规模落地做好了准备。

从超级助手最关键的实现路径——AI技术来看，我们距离最终的目标又还有多远？

我们距离超级助手还有多远？

正如《钢铁侠》中的贾维斯一般，在「模力时代」下，大众对超级助手的想象，也是一个“统筹一切”的AI个人助理。

对此，高通产品管理高级副总裁兼AI负责人Ziad Asghar，这样描述过对于AI个人助理的想象：

在各方面，大伙儿可能都只需要1个应用就能完成所有任务，如生产力APP、娱乐APP等，再用一个AI个人助理来“统筹一切”，这将会是一场极具颠覆性的变革。

当下，AI技术正迎来以大模型为代表的生成式AI爆发的阶段。

高通公司总裁兼CEO安蒙近期接受《独立报》采访时，如此强调生成式AI给终端带来的重要性：

生成式AI将赋能用户大大提升查找文件的效率，以直观高效的方式进行视频创作和修改…将这些处理能力引入终端，人们会看到大量应用场景涌现。
纵观智能手机领域，AI的发展有望开启一轮全新的增长周期。只有强有力的技术变革才能推动手机市场的变革。我们将生成式AI视为一次千载难逢的机会，基于智能手机的新一轮创新浪潮已势不可挡。

而作为“被认定是最有可能实现超级助理”的实现路径之一，大模型距离成为这样一个超级助理，或许还有三方面的条件。

其一，思考方式的改变，也就是进化出更强大的自主学习能力。

正如同AlphaGo从模仿人类到超越人类一样，这部分的关键在于教它学会自我提升，理解行动的目的。

除此之外，大模型的思考方式也应该从“系统1”到“系统2”发生转变，从不假思索地预测，到真正缓慢理性的思考。