“人工智能+”时代我国大模型产业差异化发展路径研究

0

齐 荣 刘腾飞 王 强 黎小双

摘 要:近年来,以ChatGPT、文心一言等为代表的人工智能大模型相继发布,其能力快速迭代更新,标志着人工智能技术的重大飞跃。这些大模型不仅仅是技术创新的前沿成果,更是推动产业革新、激发经济新模式、培育发展新动能的新质生产力。在产业发展浪潮和国家政策引导下,全国多地抢抓大模型机遇,开展大模型创新算法及关键技术研究,致力于打造人工智能创新高地。然而,与欧美发达国家相比,我国大模型发展仍存在不少短板和弱项。同时,地方在发展大模型产业过程中,也存在项目盲目跟风等问题。对此,各地应立足区域发展基础,围绕我国大模型技术演进路线及存在短板,科学布局大模型产业,协同做大做强我国人工智能产业。

关键词:大模型;发展模式;算力;人工智能 

一、发展背景及趋势

当前,人工智能技术的快速演进将大模型推向了全球科技竞争的制高点,相关技术进入成果爆发期,通用大模型、行业定制大模型、端侧大模型蓬勃发展,使得大模型产业的应用落地和商业化进程显著加速。这些模型不仅在技术上实现了突破,更在推动各行各业的数字化转型和智能化升级中发挥着核心作用,推动人工智能发展的奇点时刻更快到来。大模型技术的发展呈现以下三个明显趋势:

(一)模型训练算力增长速度超越摩尔定律

随着大模型参数规模的持续增大,其算力需求也快速增长,相较于深度学习时代,大模型的整体算力需求已实现2-3个数量级的跃迁。以英伟达为代表的人工智能芯片厂商加速推进计算芯片创新升级,在过去8年间,英伟达GPU单卡算力性能增长了1000倍,远超芯片摩尔定律的晶体管数量每18个月翻一倍的增长速度。未来10年将是人工智能算力的“超摩尔时代”,通过计算芯片、软件栈、网络等智能计算系统全域协同优化,构建出大型人工智能超算集群,将进一步超越摩尔定律的约束。

(二)龙头企业创新牵引推动大模型创新

大模型发展浪潮主要由大模型算法企业和智能芯片设计企业共同主导,技术门槛高,高科技龙头企业的主体作用明显。从大模型看,2022年年底引爆行业的ChatGPT以及2024年爆火的Sora均由OpenAI公司研发推出,受业界广泛认可的开源大模型LLaMA系列由Meta公司推出。国内的ChatGLM、通义千问、文心一言等也均由人工智能领军企业研发推出。从智能芯片来看,英伟达、AMD等龙头企业主导并推动了算力变革,国内华为、摩尔线程等企业也在加速追赶。

(三)高质量数据集支撑模型训练

大量高质量的数据是人工智能训练和学习的基础,数据对于人工智能就如同燃料对于引擎,丰富的数据能让模型更好地理解和识别各种模式,随着数据的不断积累和更新,模型还可以持续进化并提升性能,更好地适应不断变化的环境和需求。OpenAI公司为迭代升级GPT模型,投入大量资金和人力建立高质量数据集,从维基百科、电子书、新闻网站、博客、推特和Reddit等平台和论坛中搜罗了大量数据用于模型训练,数据要素产业也因此迎来了发展风口。

二、大模型发展现状及面临挑战

随着人工智能领域中大模型技术的快速发展,我国各地方政府纷纷出台相关支持政策,加快推动大模型产业的持续发展,但在发展过程中也面临一些挑战和瓶颈。

(一)区域分布上,全国形成三大聚集区

目前,我国已经形成了京津冀、长三角、珠三角三大产业集聚发展区,涌现出一批行业龙头和独角兽企业,推动我国人工智能产业集群快速发展,其中,北京在全国优势突出。《中国新一代人工智能科技产业发展报告2023》显示,在全国2200家人工智能骨干企业中,北京的企业数量占比为28.09%,位居全国第一。全国已有117家“大模型”完成备案,其中北京市51个、上海市24个,广州市9个、深圳市8个、杭州市7个,其他城市备案数量均不超过2个。赛迪顾问发布的《中国人工智能区域竞争力研究报告(2024)》显示,我国31个省(市、区)人工智能发展分为四个梯队,其中北京、广东、上海形成的引领者梯队具备明显优势;浙江、江苏、山东、湖南构成的挑战者梯队已初步形成区域特色产业;安徽、四川、天津组成的期待者梯队产业基础较为扎实;其余19个省(市、区)处于跟随者梯队。

(二)算力、算法、数据三大要素方面依然存在短板

算力方面,发展供需不平衡、“大而不强”的现象仍然存在,主要表现在芯片关键技术受制于人,我国算力关键技术面临“卡脖子”问题,超算算力和智算算力总体规模较小。算法方面,与欧美国家相比,国内企业仍然存在差距,底层架构设计方面,目前国内外大模型训练时均采用谷歌公司的Transformer模型,国内尚没有类似的底层架构,大模型的预训练方面只能“在别人的地基上盖房子”。在大模型的迭代升级、更新换代方面,国内企业也普遍落后于欧美企业,竞争劣势较为明显。数据方面,虽然我国的数据量很大,但产业化发展还存在不足,相对标准化的数据服务商较少,数据质量普遍较低,存在不少噪音和错误,使得大模型的训练面临巨大挑战,影响了模型的准确性和稳定性。

(三)演进路线上,垂直行业应用成为竞争关键赛道

通用大模型的国内应用主要围绕写作、作图等浅层阶段,而深入场景、靠用户驱动的行业大模型将会迎来爆发式增长。与通用大模型相比,垂直行业大模型能够更直接地深入特定行业与业务场景,更精准地满足行业特定需求,弥补通用大模型无法最优化适配到垂直行业中的不足。国内大模型的发展路径是“通用+垂直”双轨并行,其中垂直类大模型落地速度最快。通过通用大模型企业和行业头部企业的联合创新,教育、旅游、医疗、汽车、化工、生物医药等垂直行业大模型大量出现。2023年12月,中国信通院发布的《2023大模型落地应用案例集》评选出52个大模型商业落地优秀示范,其中超过65%为垂直行业应用。

当前,我国大模型发展势头迅猛,各地和各大企业纷纷加大对大模型的布局,但部分地方仍简单地将发展大模型归结于硬件投资,盲目跟风上项目,很可能导致大模型项目的过度投资、重复布局和低效建设。从全国发展布局来看,一方面发展大模型门槛高、投入大,人才素质要求高,在我国众多地区不具备研发和培育通用大模型的基础条件。另一方面,我国大模型在算力、数据和应用等多方面仍存在短板,产业化水平不高。各地发展除了需要聚焦大模型本身,更应立足区域发展水平和企业发展条件,合理布局发展大模型产业链,联合做大做强我国大模型产业。

三、产业发展模式分析

通过地方实践,我国大模型产业初步形成了三种主要发展模式,即产业聚集和技术创新模式、行业应用导向模式以及资源要素导向模式。

(一)产业聚集和技术创新模式

以北京市、上海市和深圳市等地区为典型代表,此类地区是我国大模型产业发展的高地和聚集区,科研实力强大,人工智能软硬件优势突出。在推进路径上,此类地区应重点推进大模型基础理论研究和关键技术的突破,建设具有全国影响力的数据要素市场、打造优质数据流通产业生态,研发具有全球影响力的通用大模型底座。此外,全面推动软件企业融入大模型,引导行业领域开放应用场景,以“通用大模型+行业模型+软件生态”等多要素合力建设大模型产业集群。

以北京市为例,北京致力于打造大模型之都,预计2025年基本形成要素齐全、技术领先、生态完备的通用人工智能大模型产业发展格局。在推进路径上,北京市将推动人工智能大模型创新体系发展作为重点任务,通过揭榜挂帅、创新联合体等方式,支持新型研发机构、领军企业、创新型企业等各类创新主体攻关大模型全流程关键核心技术,推进开源开放,打造全栈国产化人工智能体系。此外,北京市重点围绕提升算力资源供给、提升高质量数据要素、推动创新场景应用等维度全面构建全产业链生态。

(二)行业应用导向模式

以重庆市、武汉市和苏州市等地区为典型代表,此类地区人工智能产业链相对完善,已形成一批具备竞争力的人工智能产品和行业解决方案,同时,这些地区传统产业基础雄厚,应用场景丰富,为大模型的应用提供了广阔空间。在推进路径上,重点以行业模型和高质量行业数据集为抓手,推进大模型在行业的应用示范,以提供软硬件一体化解决方案为目标进行招商和布局产业,占据产业链高端环节。

以武汉市为例,武汉市是我国中部地区首个软件名城,在基础软件、工业软件、嵌入式系统、遥感解译、地理信息等领域优势突出,已形成涵盖基础层、技术层、应用层的较为完整的人工智能产业链,在智能机器人、智能网联汽车、机器视觉等领域形成了一批特色产品。但在发展大模型产业方面,武汉市有影响力的大模型龙头企业较少,缺乏有影响力且能够面向用户提供服务的大模型,本地的人工智能人才缺口较大,制约了当地大模型产业的发展。在发展路径上,武汉市拟选取工业制造、医疗健康等重点行业领域开展数据产品开发利用,形成高价值数据集,推动人工智能企业与各领域头部企业合作,打造深度匹配行业需求的人工智能垂直领域大模型,在制造、医疗、教育、物流、城市治理等领域培育应用场景,打造大中小场景协同发展体系,形成场景牵引大模型产业发展的良好局面。

(三)资源要素导向模式

以贵州、宁夏、内蒙古等地区为典型代表,围绕算力资源导向,由政府主导建设高水平的算力基础设施,营造有利的政策环境,依托区域能源禀赋和气候优势构建算力综合成本优势,以算力资源和价格进行强有力的招商引资。一方面为落地的大模型龙头企业提供配套产业和服务,另一方面,依托全国一体化算力网,将本地算力服务于全国大模型企业。围绕数据要素资源导向,以大同、海口等地区为典型代表,通过建设全国数据标注基地,助力行业大模型产业化。

以宁夏为例,宁夏气候环境适宜,数据中心采用全自然风冷,PUE值最低达到1.1,年平均气温8.8℃,全年环境优良天数达280天以上,非常适宜建设全自然风冷数据中心,是国家认定的最适宜建设数据中心的一类地区,同时其电力供给充足稳定、价格优惠,数据中心到户电价不高于0.36元/千瓦时。在推进路径上,宁夏以智算来抢占大模型风口,已建成我国西部唯一的算力和互联网交换“双中心”和全国首批“万卡级”智算基地,算网融合支持落地企业开展大规模模型训练,建成了全国首批人工智能芯片适配基地,可以为国产芯片提供测试、验证等服务。下一步,宁夏将尽快建成全国大型智算基地,依托“东数西算”,让宁夏的电力变成全国的算力,支持全国大模型产业发展。

四、总结与展望

今年“人工智能+”首次被写入《政府工作报告》,凸显了以大模型为代表的人工智能技术已成为国家发展战略的关键组成部分,因此前瞻布局大模型产业是各地区因地制宜发展新质生产力的应有之举。当前,大模型产业化进程以前所未有的速度提档推进,技术潜力与市场空间巨大,但实现与产业场景的深度融合离不开各方合作。面向未来,我国需进一步加强产业协同攻关和技术创新,在全国范围内强化算法、算力和数据以及通用大模型和行业模型等各层级生产力要素的统筹布局,从技术、市场、政策等多维度支持共同推动我国大模型产业的突破性发展,打造新质生产力重要引擎。

参考文献

[1] 《北京市人工智能行业大模型创新应用白皮书(2023年)》[J].中国信息安全,2023(12):92.

[2] 李论.大模型发展仍需系统布局,有序引导[J].通信世界,2023(14):7-7.

[3] 汪玉凯.“数据要素×”与“东数西算”:全国一体化算力网建设的关键[J].人民论坛,2024(08):52-56.

[4] 赵子忠,王喆.2023年国内大模型发展综述与趋势研判[J].青年记者,2024(02):44-47.

[5] 肖仰华.生成式语言模型与通用人工智能:内涵,路径与启示[J].学术前沿,2023(14):49-57.

[6] 陈婵,韩栩仟.武汉数字经济高质量发展探索[J].合作经济与科技,2024(5):34-35.

[7] 石勇,刘平,冯锦源.“东数西算”宁夏节点数字经济产业发展研究[J].大数据,2023,9(05):100-110.

(作者单位:中国信息通信研究院工业互联网与物联网研究所 、中国信息通信研究院产业与规划研究所) 

评论被关闭。