抢抓通用人工智能历史新机遇

刘庆峰

认知大模型正成为通用人工智能发展的曙光，它通过对海量数据进行高质量“清洗”，再通过统一的、包括上千亿浮点参数的神经网络大模型进行记忆和训练，再经过人机协作强化学习等一系列创新方法，实现在通用领域的智慧涌现。

一定意义上，认知大模型获得了像人类一样触类旁通的能力，因此它带来的不仅仅是内容生产和分发方式的全新变化、人机交互的根本性变革，而且会对科研、办公以及工业物联网带来全新的颠覆和机遇。因此，传统意义上，依靠工作时长和人力的产业模式在未来两三年内将会被彻底改变。所以，认知大模型在历史上的战略意义，相当于个人电脑和互联网的诞生，这样的论断可以说毫不夸张。

近期，通用人工智能发展的标志事件是ChatGPT的发布。2023年5月，讯飞星火认知大模型（以下简称“讯飞星火”）发布，提供了48个最主要的功能。在科大讯飞的人工智能开放平台上，有400多万开发者团队在从事通用人工智能相关能力的开发，为我们带来当前人工智能七个维度的能力，包括：文本生成能力、语言理解能力、知识问答能力、逻辑推理能力、数学能力、编程能力、多模态能力。这一认知大模型在一定意义上属于对话式通用人工智能。在这方面，其语言理解能力、文本生成能力等都跟语音和语言直接相关。科大讯飞从2011年起就开始承建“语音及语言信息处理国家工程实验室”，开发了很多智能语言和语音相关产品。

除了这些进展之外，科大讯飞与中国科学技术大学共同建设认知智能国家重点实验室。科大讯飞的机器人在国家临床执业医师资格考试中获得的成绩，超过了96.3%参加考试的医生。在作文批改领域，科大讯飞的机器人在批改高考语文作文、四六级英语作文、雅思英语作文时，比一般老师还要准确。

在英文的阅读理解方面，在基于斯坦福问答数据集的国际权威自然语言理解比赛中，“讯飞星火”在全球首次超过人类平均水平；在2022年艾伦研究院组织的OpenBookQA科学常识推理比赛中，其水平同样超过了人类平均水平。

OpenAI发布ChatGPT给国内大模型领域带来很大的触动和惊喜。经过快速验证之后，我们觉得科大讯飞有成建制的力量，有完整的算法储备。所以，2022年12月，科大讯飞正式启动“1+N”认知大模型的专项攻关。其中，“1”是通用认知大模型，直接对标ChatGPT；“N”就是各个专用系统，覆盖教育、医疗、汽车等方面。我们的认知大模型要快速追赶并努力超越其他同类大模型，离不开一套科学且成体系的评价方法。所以，科大讯飞以认知智能国家重点实验室为依托，根据人工智能的七个维度，提出一系列分解方法，同时又和中科院人工智能产学研创新联盟、长三角人工智能产业链联盟共同探讨，最终形成七大类包含481个细分任务的关键测试方法。这些方法既可用来评测技术，也可以预见下一步的科研方向，同时对各个应用在各个领域的落地形成指导。

“讯飞星火”具备文本生成、语言理解等多种能力。例如，向它提一个问题:“祖冲之在2023年世界智能大会上说了什么?”对于该问题，它做出了正确的判断，但不做相应的回答。而对于另一个要求:“请帮我编一个故事，说一说祖冲之在世界智能大会上做代言的故事。”这时，它就开始自由发挥。对于提出类似写作稿件的要求：用英文写一篇2023第七届世界智能大会的宣传稿，向全世界推广宣传此次大会“智行天下能动未来’的主题。可以看到，“讯飞星火”可以很好地完成该任务，其英文功能在开发伊始就是同步开发的，将来还将扩展更多的语种。在语言理解能力方面，不仅“讯飞星火”具备深度理解语言涵义的能力，同类的语言理解深度模型都具备这样的能力。从语言理解的底层来讲，“讯飞星火”对于句法和字词的理解可以达到令人非常惊喜的程度。

如今，大家都在谈生成式人工智能或通用人工智能应具备可解释性的底层逻辑，如在智慧医疗领域就需要具备这样的能力。目前，科大讯飞的“医智助理”已经为5亿人次提供诊疗建议，掌握了很多通用知识。科大讯飞推出的通用人工智能产品暂时不涉及医疗领域，因为它需要经过更严谨的研发和测试，才能提供给每一个家庭。不久后，科大讯飞将推出医疗专用的认知大模型，使其成为每个人的健康助手和每位医生的诊疗助理。

另外，“讯飞星火”还具备数学能力、编程能力等。关于“讯飞星火”的多模态能力，它不光可以根据要求生成相关的语言文字，还可以合成一个虚拟的女生形象，并用语音朗读这些文字。

虽然大模型具有很多优势，但也面临一些挑战。传统大模型主要通过参数记忆和历史数据训练出来的，无法满足实时的新闻信息需求。此外，还存在对一些似是而非问题的张冠李戴、给传统典籍编造情节等问题。目前还不能从根本上解决这些问题，只能用一个办法，即调用各种插件来解决模型的可靠性问题。但这需要大模型具有超强的语言理解能力。

抢抓通用人工智能的机遇，有以下几个基本要素。

第一，必须立足自主可控的平台。例如，曙光、华为、寒武纪都在科大讯飞部署了“特战队”，形成了合作伙伴关系。第二，中文和英文功能必须同步。“讯飞星火”（2023年5月6日发布的版本）不仅在数学能力方面超过了ChatGPT，在中文文本生成方面也实现了对ChatGPT的超越；在英文文本生成方面，如果以5分为满分，ChatGPT为4.48分，“讯飞星火”已经达到4.29分。第三，在“硬碰硬”的科技对比上，不仅要学习还要想办法赶超同类大模型。对于数学能力和编程能力，“讯飞星火”在数学能力方面已经超过ChatGPT，并且还在不断进步；在编程能力方面，由于现在的数据比较少，还存在可提高空间。

通过科技对比，我们不仅仅要向别人学习，还要做到更好。在通用人工智能方面，科大讯飞正在建设联合实验室，在中国科学技术大学、清华大学等很多高校开始进行更前沿的源头技术创新。因此，一定要制订从追赶到超越，再到原始创新的系统性推动计划。

今天，对于400多万人的开发者团队，科大讯飞用500多项人工智能为其赋能。而“讯飞星火”大模型的通用人工智能会进一步为开发者赋能，极大地降低创业者的门槛，他们只要给出提示，提供创意和灵感，那么很多事情就可以交给人工智能来做。

（作者系科大讯飞创始人、董事长。本文根据作者在2023年第七届世界智能大会发表的演讲整理，发表时略有删减。）

相关文章

原位固化的全固态电池技术发展历程

固态电解质电池的研发、应用与发展

全固态电池的研发现状与产学研协同创新的前景