发展通用人工智能需从大模型基座做起

0

毕成良

2024年2月,美国OpenAI公司推出Sora大模型,能根据文本指令生成具有真人电影画质的模拟3D视频,其背后与ChatGPT4.0同源的通用大模型基座再次引发社会热议。人工智能包含通用人工智能与专用人工智能。长期以来,我国更多注重在工业、气象、交通、航空等具体领域的专用人工智能的发展,美国则致力于研发能应用在所有领域的通用人工智能。从人工智能最新发展态势看,我国应进一步加强通用人工智能的研发与攻关,发展技术自主的超大规模的大模型基座。

一、通用人工智能的最新发展态势

(一)大模型的特点与分类

所谓“大模型”(Large Model)实际上是一套使用海量数据预先训练而成的模拟人类神经网络的知识库和程序。大模型具有三个特点:预训练、生成式和大规模。首先,大模型需要“预训练”的知识库。人类把知识与信息转化成海量数据来训练大模型,大模型成为能用所有人类语言交互的强大知识库。其次,大模型能够自主生成新内容的程序。大模型是目前最强大的信息处理和数据发掘工具,可以在不预先设定任何规则的情况下,自主发现新规则,并生成和输出新内容。最后,大模型智能水平来自于其硬件与软件的超大规模架构。大模型的底层架构是模拟人脑神经细胞和神经网络,每个基本单元的结构与活动都是简单的,但是860亿简单个体的聚合引发了智力的涌现。 

大模型可根据预训练的数据规模和硬件能力分成三个层次,即基础层、行业层、应用层。基础层是大模型基座(也称通用大模型),通常具有万亿参数以上,具有多模态功能。中间层是行业大模型,在通用大模型基座之上使用行业相关数据再次训练而成。应用层是垂直行业的商业化大模型,大模型基座主要面向个人消费者。大模型基座的“超大规模”是通用人工智能得以实现的基础。

人工智能与骨科医学相结合,打通预防医学与临床医学的“最后一公里”。刘长杰/摄 

(二)通过大模型基座实现通用人工智能具有可行性

2023年之前,业界对建造大模型基座普遍持怀疑态度,因为从技术能力看,搭建大模型采用Transformer神经网络架构、核心算法和智算芯片的性能,不过目前这些都没有得到实质性提升。从成本收益来看,通过堆叠超大规模的芯片,“投喂”海量数据的方式实现智能不太现实,需要耗费巨大算力、电力和人力,经济回报也不乐观。但2023年通用人工智能的发展态势充分说明,通过建造一个规模巨大的大模型基座来实现通用人工智能(AGI)应用的路线在技术、商业、文化层面上都是可行的。主要表现如下。

第一,从技术发展看,通用人工智能的认知能力正从“量变”转向“部分质变”。通用大模型凭借强大的信息处理能力,正从机器学习的感知阶段走向认知阶段。在文字方面,大语言模型可以阅读、翻译、润色、写作。在语音方面,大模型可以通过声波的信号分析学习语言语音数据,实现自然语言的识别和语言输出。在图像方面,大模型能识别并生成各种风格的图像。在视频上,视频大模型Sora则能识别现实世界的物理规律,构建符合真实世界规律的高仿真模拟视频。

第二,从产业金融看,通用人工智能几乎已成为美国科技界与金融界在未来十年的主攻方向。目前美股市值排名前七的公司均宣布全面进入AI赛道,硅谷有一半创业企业围绕ChatGPT开展业务。美国AI产业格局已基本形成,OpenAI以及微软公司成为第一梯队,技术水平远超其他同行,谷歌、Mete、特斯拉、亚马逊、苹果位于第二梯队,同时还有Anthropic、Cohere等专业做大模型的一批小独角兽企业作为第三梯队。美国金融投资界给予AI相关公司超高估值。

第三,从文教传媒看,通用人工智能展现出对文化、传播、教育的强大塑造能力。通用人工智能将要改变人们获取信息的形式与渠道。作为当前最强大的信息交互手段和知识检索系统,大模型可以进行文字、图像、音频、视频等多模态交互,将要成为人们习以为常的数字内容生产与交互的新形式。通用人工智能将改变人类的知识讲述与传承方式。大模型作为强大的能使用人类自然语言的交互式知识库,通过动画、电影、电视剧、3D游戏等方式影响人类的审美观念,从而影响公众的价值观,引导社会舆论。

二、美国通用人工智能发展的路线图

美国业界正全面布局通用人工智能赛道(All in AI),希望把通用人工智能作为一项颠覆性技术,以挽回美国经济脱实向虚及产业空心化的趋势,展现出“近、中、远”三步走的路线图。

第一步是信息产业界,通用人工智能技术颠覆性改变现有IT与互联网的电子产品,进而掌握未来信息通讯产业格局及标准。首先是“AI+软件”。大模型将重构现有大部分应用产品的交互方式和使用体验,形成以通用AI为核心的搜索、办公、编程等一系列工作与生活软件生态系统。其次是“AI+终端设备”。AI版的操作系统将存在于所有电子设备中,催生新一代的AI手机、AI电脑以及可穿戴设备和游戏装备。这个趋势如同2010年智能手机淘汰上一代的功能手机时一样。最后是“AI+6G通讯”。未来AI大模型基座将赋能网络,实现与电信网、卫星互联网、智能汽车互联网、物联网的融合对接。

第二步是文化媒体界,通用人工智能技术将重塑文化传播与知识获取方式。一是“AI+社交媒体”。当AI操作系统的手机电脑被普遍使用,AI将重塑获取、传播和利用知识的方式。二是“AI+教育”。AI将极大拓宽文化传播渠道和丰富文化传播方式。三是“AI+科研”。未来超级AI有望在量子科学、生物科学、新材料、核聚变等方面成为科学家的超级助手。

第三步是工业产业界,通用人工智能技术将颠覆现有工业生产逻辑,引领智能时代的工业革命。一是“AI+通用机器人”。通用人工智能使人形机器人能听懂人类语言,与人实时交互,应对复杂场景。通用人工智能将深刻变革人类的生产生活方式。二是“AI+工业制造”。人形机器人可以承担流水线工作,而工业领域的大模型能够成为超级工程师,“一个模型,万种应用”,自动分析各行业的具体问题,显著缩短设计和检验时间,优化生产流程,消除重复性劳动,提高生产效率和质量。

三、我国发展通用人工智能产业面临的挑战

通用大模型产业的特点是:高层次顶尖人才的投入大,创投科技业态发展灵活,与半导体产业联系紧密,与文化舆论国际传播高度关联。在上述方面我国还面临一些挑战。

(一)现阶段全面部署大模型基座对我国半导体与信息产业具有一定挑战

我国大模型与美国在模型、算力、数据源方面存在一定差距。2023年我国人工智能行业虽号称有“百模大战”,但我国大模型多专注于某具体行业与垂直领域。在模型架构方面,我国互联网大厂的大模型多数是围绕自身业务场景,并且是利用自身行业知识在国外开源大模型的基础上训练出来的。在算力方面,我国互联网行业较为依赖英伟达公司的GPU智算芯片及CUDA开发框架系统。在美国“算力削减”政策打压之下,AI高端芯片价格非常昂贵,而且被限制采购。在数据方面,我国数据源的规模较少、质量较低且处理能力较弱,能对大模型需要的海量数据进行清洗、加工、处理的产业链还未健全。

(二)发展通用大模型产业对我国创新体制提出更高要求

在人才方面,国内创业环境对高层次技术人才的吸引力还有待优化,国内对如何培养和使用顶尖人才尚未达成社会共识。在市场机制方面,原创性创新的生态体系不健全,缺乏共享软件的社群文化,制约了创新型企业群体的涌现。在资金方面,通用大模型基座投入巨大,商业回报率低,依靠社会力量投资进行大模型基座建设的机会或已错失。

(三)通用大模型将对国家数据和文化安全带来挑战

在数据安全方面,人工智能本身也可能成为破坏网络安全和管理的工具。用户把个人信息“投喂”给大模型,这些数据中可能包含用户的大量敏感信息,容易出现数据窃取或者“数据投毒”风险。在文化安全方面,我国面临更加复杂的国际舆论环境。AI给自媒体提供了强大技术工具,能够将误导信息、敏感内容与真实信息无缝衔接,各国的历史文化可能被随意曲解。人类知识库也面临被恶意篡改的风险。

四、我国发展通用人工智能的对策建议

我国发展人工智能要形成两个共识。一是通用人工智能与专用人工智能两者不能彼此替代,我国必须发展自己的通用人工智能。二是发展通用人工智能,必须扎实地从超大规模的通用大模型基座做起。

(一)在大模型基座方面,发挥新型举国体制优势,抓住通用大模型基座“牛鼻子”,形成新质生产力

参与主体方面,鉴于当前商业投资大模型的成功率很小,应当从国家层面重点支持2-3家单位,研发与搭建通用大模型基座。其他科研机构、企业应当紧密配合,多措并举,多路并行,致力构建基础大模型的具体细分方向。从智算芯片的生产、人工智能的开发框架、大模型底层架构设计等关键环节入手,力争实现自主创新和突破。扎实做好超大规模大模型基座的基础研究,鼓励科研机构以及企业,寻找Transformer主流架构之外的新架构与核心算法,找到更加节能高效智能的大模型设计方案。

(二)在AI基础设施方面,构建国产智能算力芯片全产业链,为实体经济提供坚实算力底座

培养技术自主的国产算力与芯片生态,包括GPU智算芯片、HBM高带宽内存、AI光通信模块等。完善以算力为核心的人工智能基础设施建设,打造覆盖全国的公共算力网络,建设国家级智能算力中心,为千行百业赋能,提供充足的廉价的公共算力,降低中小企业的算力成本,更好打造智能化制造的基础底座,驱动制造业智能化转型。

(三)在AI应用市场方面,把开放创新作为培育人工智能生态体系的必由之路,营造良好的中小企业创新创业生态

通用人工智能在商业应用市场的繁荣发展与创新要依靠广大中小企业。应兼顾“闭源”和“开源”两种发展路径,培育以公共开源为中心的产品生态,促进产业生态圈的健康发展。开源大模型有利于中小企业共享技术红利,为行业应用开发和开源生态提供低成本技术支撑,吸引外部人才参与项目协作,改进相关技术,共享知识成果,共同推动各种参数规模、技术架构、模态、场景的大模型应用。

(四)在数据与科研方面,推动大模型与基础科研结合,发展高质量数据产业链

国家大力支持数据类企业做好大模型预训练的数据集,知识库和底层数据清理工作,以高质量数据助力大模型迭代升级。建立公共教育大模型平台和权威开放的知识交流平台,处理好数据安全、数据治理与数据开发利用三者之间的平衡关系。构建以人工智能支撑基础和前沿科学研究的新模式,加速我国科学研究范式变革和能力提升。

(五)在安全与治理方面,推进人工智能治理的国际合作,保障数据安全、网络安全与文化安全

加强风险研判,开发针对大模型的数据防护技术,避免数据被不当使用或泄露,保护国家安全、公民隐私和个人权利。注重和加强全球合作,协同制定标准和制度规则,有效防控人工智能带来的科技伦理风险。

(作者单位:中国国际经济交流中心) 

评论被关闭。