2026 年人工智能发展的七个判断

0

王    强(腾讯研究院)

摘    要:全球对通用人工智能的坚定信仰并未消退,推动着业界在更底层、更艰难的方向持续探索,AI 新产品、新形态和新应用模式层出不穷,在多个行业落地并开花结果。本文通过对研究驱动、物理 AI、智联网、个性化软件、AI 原生硬件、行业价值、AI 安全等七个方面变化趋势的前瞻,构建了 2026 年人工智能演进的关键坐标。

关键词:研究驱动;物理 AI ;智联网;个性化软件;AI 原生硬件;行业价值;AI 安全

大模型的火热已进入第三年,模型间的能力差距与训练范式差异越来越小,头部模型的排名交替领先。全球对通用人工智能(AGI)的坚定信仰并未消退,推动着业界在更底层、更艰难的方向持续探索,AI 新产品、新形态和新应用模式层出不穷,在多个行业落地并开花结果。展望新的一年,以下七个关键词,或许可构成理解 2026 年人工智能演进的关键坐标。

一、研究驱动:从规模效应到范式突破

研究驱动仍是大模型产业最底层、也是最具决定性的力量。小团队并行探索、“多方向赛马”的组织方式,依然被证明是面对高度不确定性技术路线的最优解。2026 年,突破不再只来自更大的规模,而可能来自更好的架构和新的范式。

底层创新有望多点开花。从持续学习、在线学习,到长期记忆,研究重心从训练一个更聪明的模型,转向构建一个能持续进化的系统。持续学习有望成为继后训练强化学习之后的新范式,让模型在真实交互中安全、稳定地获得新能力。谷歌提出的嵌套学习,则尝试用快慢系统解决灾难性遗忘问题,为模型注入长期且动态可更新的记忆。

一批高度非共识的实验室正在涌现。由伊利亚·苏茨克维、米拉·穆拉蒂、李飞飞、杨立昆等领衔的实验室,并不简单押注规模,而是在安全、空间智能、演化式 AI、液体神经网络、群体智能等方向展开探索。这些路径短期内虽未必能复制 ChatGPT 的商业成功,却可能孕育新的范式跃迁。

与此同时,评测正在从刷榜工具转变为研究牵引器。传统静态评测面临数据污染、标注失效等问题,已难以反映真实智能水平。面向长期任务、多工具协作、动态环境的 Agent 评测体系,正在成为新的共识。评测不再仅仅是看问题答得对不对,而是看能不能在复杂世界中持续达成目标任务。

“AI for Science(科学智能)”将从研究走向更大范围的科研系统重构。AI 正在被嵌入实验系统本身,包括自动化实验室、 AI 编排实验流程、机器人执行、数据闭环回流,让 AI 从建议者变为执行者。这意味着材料科学、化学工程、药物研发等领域具备了系统性加速研究的条件,让 AI 从科学家助理走向助理科学家。

二、物理 AI :从数字大脑到具身智能

物理 AI 是人工智能进化的下一个重要阶段,它标志着 AI 可以从屏幕里的助手变成现实世界的参与者。这将让大模型从预测下一个文字 Token(词元),升级到预测下一个状态空间,让机器真正理解三维世界。物理 AI 融合了重力、摩擦力、惯性等真实的物理状态,让机器能够在现实场景中精准执行复杂任务。

仿真将在物理 AI 训练中承担重要角色。真机采集数据往往采得慢、采得贵,而在较为可控的任务和环境内,仿真能以低成本覆盖光照、遮挡、碰撞、摩擦、磨损等长尾场景,支持可复现的回归测试与安全验证,便于跨本体、跨传感器的统一对齐。

物理 AI 将优先在自动驾驶、人形机器人、智能制造等领域落地。如 L3 级自动驾驶汽车在更大区域获得上路许可,L4 级无人驾驶出租车商业化将渐成规模。特种机器人进入矿区、深海或核电站执行维修任务,替代人类处理高风险工作。人形机器人将在制造业的柔性装配、汽车产线的不规则零部件搬运工作中,商业与服务业的送餐、零售补货工作中,酒店、营业厅和医院引导服务领域等更多地出现。

三、智联网:从智能工具到智能体(Agent)协作网络

传统互联网遵循着从用户规模扩大,到网络价值提升和形成壁垒的发展路径,但 AI 时代呈现出不同特征。尽管 ChatGPT 周活用户超过 8 亿,但大模型并未因用户增长而自动变强,缺乏类似电商双边网络或社交网络的连接效应。这源于“裸模型”阶段的本质局限,即用户使用大模型多为一次性、私有化,难以形成有效的数据回流和用户间协作。

智联网的兴起提供了破局思路,其发展将呈现两个方向:一是“+AI”模式,即现有的 APP 通过增加 AI 技术来提升功能,这也包括大模型自身的平台化尝试,如 ChatGPT 推出的智能购物、群聊功能和 Sora 2 在视频社交领域的尝试。

二是“AI+”的颠覆性形态,构建以智能体为节点的协作网络。未来的 Agent 网络效应有多重形式,如交易型网络可形成 AI 双边市场,使私人助理 Agent 直接调用各类服务 Agent ;知识型网络让模型在真实场景中积累技能经验,实现越用越聪明;工作流型网络通过任务模块化降低使用门槛;社交型网络中的 AI 作为超级连接器,主动匹配协作需求。

智联网的意义在于构建以模型为认知核心、应用为关系容器、Agent 为基本节点的智能网络。这种新型平台将突破传统网络效应局限,实现从生产力工具向智能协作平台的跃迁,开启 AI 时代原生的网络价值创造模式。

四、个性化软件:从标准化产品到情景化创造

AI 编程正推动软件开发进入全新范式。正如 AI 专家安德烈 · 卡帕斯提出的软件 3.0 概念,我们正经历自 20 世纪 40 年代以来最深刻的软件开发变革。人工智能公司 Anthropic 的首席执行官达里奥· 阿莫代(Dario Amodei)预测,2026 年几乎所有代码都可能由 AI 生成。这一预测正在成为现实:据媒体报道,美团目前的新代码中约有52% 由 AI 生成,90% 以上的工程师广泛使用 AI 编码工具;腾讯数据显示,超过 90%工程师使用 AI 编程助手 CodeBuddy,50%新增代码由 AI 辅助完成。

编程门槛急剧降低,推动个性化软件时代来临。软件生产的核心瓶颈从编码技能转向问题定义能力,自然语言成为主要编程接口,氛围程序员(Vibe Coder)这一新角色应运而生。编程不再是软件工程师的专属,而成为如 PPT 般的日常表达工具。构建成本极低使得软件具备了千人千面的生成能力,实现从人适应软件到软件适应人的范式转移。比如,个人可定制专属的购物管理工具,学生可获得针对薄弱点的复习系统,活动组织者可临时搭建报名系统,装修业主可生成报价比对工具,康复患者可创建辅助自身复健的体感游戏等。这些都将变成一句话的事儿。

用 AI 眼镜辅助工作。(图片由 AI 生成)

微软件生态兴起。部分个性化工具因解决共性问题而被分享复用,形成小规模生态,类似现在 Hugging Face Spaces 上的个人应用、Chrome 插件中的实用小工具。在软件平权的新阶段,编写软件将如写文章般简单自然。软件成为人类表达思想、解决问题的基本媒介,其核心竞争力将转向共情能力、问题定义能力和想象力。

五、AI 原生硬件:从终端载体到形态进化

AI  原生硬件并非手机、手表或家电的升级版,而是只有在大模型与智能体出现之后,才有的新设备形态。比如 AI 眼镜、AI录音笔、AI 吊坠、AI 戒指、AI 宠物等。

这些设备的共同特征,是弱化屏幕、弱化操作、长期伴随。它们不再仅仅要求用户明确下达指令,还可以通过持续感知环境、行为与上下文,理解人的真实意图,并在合适的时机主动介入。AI 眼镜构建的是第一人称的现实理解层,AI 录音笔承担的是人类思考与记忆的外包,AI 吊坠尝试成为随身的智能体入口,AI 戒指将身体状态转化为可被理解与干预的信号,AI 宠物则第一次具备了长期关系与情感反馈的可能。

从本质上看,它们不是更聪明的工具,而是人的外置感知、记忆、理解与陪伴系统。真正竞争的,不是参数、算力或功能数量,而是能否持续降低人的认知负担,并建立可信、稳定的智能关系。

六、行业价值:从试点探索到生产力重塑

AI 从早期以概念验证(PoC)和零散试点为主,逐步走向核心业务流程与一线生产系统。与之同步发生的,是评价标准的根本变化:投资回报率 (ROI) 与性价比,正在成为 AI 行业应用的第一性问题。

麦肯锡研究显示,至少在一个职能中常态化使用 AI 的企业比例从 78% 上升至 88%,但真正规模化部署 AI 的企业依然稀少,距离释放企业级价值仍有不小差距, AI 改善整体利润的案例仍较少见,AI 高绩效企业仅占 6%。

而一些最新研究揭示了令人鼓舞的趋势,谷歌云新发布的《2025 AI 投资回报率报告》调研了 3466 名企业高管发现, 88% 的早期采用者,获得了不错的投资回报。当前的积极变化,源于 AI 开始深入到行业流程。早期 AI 多以 Copilot 形态承担边缘性任务,虽然部署快、风险低,但对组织整体效率影响有限。未来可验证收益将体现在生产效率提升、客户响应加快、营销指标改善等方面,深度收益则来自流程再造、智能体协同、预测决策等领域。

未来,单个员工 + 多个智能体的形式,可能成为新的最小单元,像一家微型公司一样交付结果。这一变化,将倒逼组织在管理逻辑、绩效考核与人才定义层面进行重构,管理对象不再只是人,而是人机协同的生产系统。

七、AI 安全:从技术补丁到信任底座

随着不断逼近 AGI 的目标,AI 安全正从边缘议题走向技术与产业的核心。公众对 AI 的担忧已不再局限于极端的失控风险,而是扩展到伦理、价值对齐、可靠性与可解释性等更现实的问题。多项研究显示,尽管 AI 使用率持续攀升,但公众信任度却呈现下滑趋势,这种高使用、低信任的结构性张力,正在反向影响技术路线与商业决策。

AI 安全逐渐从事后修补的技术补丁,演化为支撑 AI 大规模应用的信任底座。其中两个趋势尤为关键:一是安全算力的制度化投入,二是 AI 治理机制的组织化嵌入。安全投入不应在模型能力成熟后被追加,而应与预训练、对齐和后训练并行推进,形成稳定、可持续的算力投入比例。尤其在智能体和长程任务场景下,安全评估已从静态基准测试转向长期行为模拟,对算力与方法论提出更高要求。

与此同时,AI 治理正在从原则宣示走向工程流程,深度介入模型设计、训练、评估与部署全过程,将风险评估、红队测试和责任审查转化为强制流程。一些前沿研究则进一步尝试将安全直接内生到训练目标与奖励机制中,使模型在能力提升的同时保持可控性与可解释性。

(作者系腾讯研究院前沿科技研究中心主任)

评论被关闭。