具身智能赋能文化遗产保护的理论逻辑与实践路径

0

宋天含    刘保山    裴    璇

(辽宁社会科学院;北大国土空间规划设计研究院(北京)有限责任公司;对外经济贸易大学)

摘  要:“十五五”时期,具身智能将为文化遗产保护实现从实体保存向体验传承的跨越转型,提供关键的技术支撑。本文从核心概念重构、多学科理论融合的内在逻辑出发,厘清具身智能赋能文化遗产保护的理论根基;剖析了具身智能赋能文化遗产保护面临的现实挑战,比如技术人文缺失、适配性不足、伦理安全风险等;提出坚守人文本位、精准适配不同遗产类型、建立伦理规范与保障机制等实践路径,推动具身智能在文化遗产保护领域的规范化、深度化应用,真正发挥技术赋能文化传承的核心价值。本研究旨在推动文化与科技深度融合,助力文化遗产活态传承,筑牢文化自信。

关键词:具身智能;文化遗产保护;未来产业;文化产业;活态传承

文化遗产作为民族精神的载体与文明延续的纽带,其保护传承水平直接关乎文化自信的筑牢与文化软实力的提升。“十五五”时期是推进文化强国建设的关键阶段。 “十五五”规划建议明确提出推进文化和科技融合,推动文化建设数智化赋能、信息化转型,发展新型文化业态。“十五五”规划建议还将具身智能列入需前瞻布局的未来产业,为文化和科技融合、新型文化业态发展提供了重要技术支撑。

作为人工智能与机器人技术深度融合的前沿领域,具身智能的核心价值在于突破传统自动化局限,通过仿生交互实现环境感知与自主决策,为复杂场景提供创新解决方案。其以具身认知为核心,打破传统技术的工具化局限,通过身体感知与情境交互的深度耦合,为文化遗产保护从“实体保存”向“体验传承”转型提供了创新性路径。当前,在文博产业数字化转型进程中,具身智能已从概念验证阶段逐步迈向规模化应用,正成为推动文博领域高质量发展的关键技术引擎。

在未来,游客参观文化遗产时,可以通过佩戴具身智能设备看到并感受文物在历史场景中的使用情况。(图片由 AI 生成)

一、具身智能赋能文化遗产保护的理论逻辑

(一)核心概念的认知重构

其一,具身智能的定位从技术工具转向人文实践。这一转变的关键,是重新界定具身智能的属性,打破传统人工智能仅作为技术工具的定位。传统人工智能以符号计算为核心,侧重数据处理与逻辑推理,形成了脱离人类主体的技术路径。而具身智能以具身认知为理论支撑,构建整合感知、运动与交互功能的智能载体,通过模拟人类身体的感知方式与交互逻辑,实现与外部环境的深度联动。两者的关键差异在于,具身智能将身体感知与情境交互作为智能运作的核心部分,而非单纯依赖数据输入与算法输出。在文化遗产保护领域,具身智能的人文实践价值十分显著,其作用不仅体现在技术层面提升工作效率,更在于搭建人与文化遗产的意义联结,通过感知交互解读文化内涵、传递文化价值,最终形成技术赋能与人文传承相融合的实践路径。例如,应县木塔建于公元 1056 年,是世界现存最高大、最古老的纯木结构楼阁式建筑 , 是我国木结构建筑的瑰宝。近千年来,历经自然侵蚀、战乱、地震后,塔身结构严重受损。在此背景下,通过具身智能赋能文化遗产保护很有必要。据媒体报道,“智慧应县木塔 2.0”技术方案目前已完成了对应县木塔藻井结构的高精度三维数字化建模,该方案集成了深度学习算法、多模态传感系统和仿生运动控制等前沿科技,通过机器狗搭载的智能 3D 视觉系统,在非接触状态下实现了毫米级的文物细节还原。此外,具身智能系统还赋予机器狗自主环境感知和决策能力,使其能在复杂地形中稳定移动和扫描拍摄。通过对比历次扫描数据,AI 算法能自动检测木材形变、漆层脱落等细微变化,为预防性保护提供了量化依据。

其二,文化遗产保护的核心从实体保存转向体验传承。随着社会发展与认知提升,新时代文化遗产保护的内涵已大幅拓展,不再局限于以实体修复与保存为主的单一模式。文化遗产的价值,不仅在于物质实体的留存,更在于其承载的历史信息与文化意义。保护工作的核心就是让这些文化意义持续传递、不断再生。这一认知变化推动文化遗产保护向具身方向转型,催生了对具身体验的内在需求。传统保护模式中,人们了解文化遗产多依赖间接的文字记载或图像资料,对文化遗产的认知始终存在距离。具身转向强调身体作为认知主体的关键作用,通过身体参与感知与情境互动,建立对文化遗产的深度认知和情感共鸣。这种转向让文化遗产保护从被动的实体守护,转变为主动的意义建构,依托体验传承让文化遗产的价值在当代社会得到激活与延续。在未来,游客参观文化遗产时,可以佩戴具身智能设备,不仅能看到文物的实体,还能通过设备提供的增强现实功能,看到文物在历史场景中的使用情况,听到当时的声音,甚至感受到当时的氛围。例如,据媒体报道,故宫养心殿数字展示即将上线,观众可通过互动设备 “亲历”乾隆元旦“明窗开笔”的仪式,在虚拟场景中感受御笔写下“天下太平”的瞬间。这种沉浸式的体验让游客与文化遗产之间建立了更深的意义联结,提升了文化体验的深度和广度。

(二)理论支撑:多学科视角下的理论融合

一是具身认知理论。具身认知理论颠覆传统认知主义的离身性假设,提出“认知是身体与环境交互作用的产物”这一核心观点。该理论认为,认知过程并非局限于大脑的内部运算,而是植根于身体的感知系统、运动能力与环境的互动关系之中,身体的结构与感知模式直接影响认知的形成与发展。这一核心逻辑与文化遗产体验存在内在的契合性。文化遗产的意义并非预设的固定存在,而是通过主体的参与和交互得以建构。文化遗产所承载的历史信息与文化内涵,需要借助身体的感知器官进行捕捉,通过动作参与与情境融合形成完整的认知体验。具身认知理论为文化遗产体验提供了核心的理论支撑,揭示了身体在文化意义解读中的核心作用,为具身智能赋能文化遗产保护提供了认知层面的逻辑依据。

二是文化传承理论。这一理论的核心是实现文化的活态延续,重点强调传承过程中的真实性、传承性和参与性。真实性要求在传承中保留文化遗产的核心内涵和本质特征,传承性注重文化价值在代际间的有效传递,参与性则突出传承主体的主动参与和实践。具身智能的特性和文化传承理论的核心要求很契合,为文化活态传承提供了创新的实现方式。传统的文化遗产传承模式常受时空限制和传承人数的影响,很难实现广泛参与和有效的代际传递。而具身智能可以搭建沉浸式的交互场景,降低参与门槛,让更多人深度参与到文化遗产的体验和传承中。同时,它具有模拟人体感知与交互的能力,能精准捕捉文化遗产的核心内涵,在传承过程中保障文化的真实性,推动文化遗产从静态的历史遗存转变为动态的活态传承对象,为代际传承提供技术支持和方向指引。

(三)具身智能赋能文化遗产保护的内在逻辑

一是认知逻辑。具身智能赋能文化遗产保护的认知逻辑核心在于实现认知模式从旁观式到沉浸式的转变。传统文化遗产认知模式以旁观式为主,主体与遗产之间形成明确的疏离关系,认知过程依赖间接的信息获取,难以形成对遗产内涵的深度理解。具身智能通过构建模拟真实情境的交互环境,将主体的身体感知纳入认知过程,实现沉浸式认知的生成。这种认知模式以身体为媒介,通过视觉、听觉、触觉等多感官的协同感知,让主体深度融入文化遗产所处的历史情境与文化语境之中。认知过程不再是单一的信息接收,而是主体与遗产之间的动态交互与意义共创,使得认知从表面的信息知晓深入到深层的意义理解,显著提升认知的深度与完整性。比如,未来,在秦始皇陵兵马俑遗址,借助全息投影与力反馈技术构建的沉浸式认知场景,游客可“走进”模拟的秦代军阵排布现场,通过调整身体姿态观察不同兵种的站位逻辑,伸手触摸虚拟兵器感受青铜材质的重量与锻造纹理,甚至能通过语音交互“询问”虚拟士兵的作战职责。这种多感官协同的认知体验,将让游客从“观看兵马俑”转变为“理解秦代军事文化”,实现认知深度的质的飞跃。

二是价值逻辑。具身智能赋能文化遗产保护的价值逻辑,核心是让文化遗产价值从静态存在转向动态再生。在传统保护模式中,人们多把文化遗产看作静态的历史遗存,其价值表达大多局限于历史意义的展示和解读,很难在当代社会建立新的价值关联。而具身智能可以激活文化遗产的交互属性,让遗产价值在当代语境中实现动态再生。比如通过模拟传统技艺的实践过程、打造文化场景的沉浸式体验等方式,让文化遗产与当代人的生活需求、精神追求产生联系,赋予遗产新的时代内涵。这种价值再生不背离原有价值,而是在保留核心内涵的基础上实现价值的当代转化,让文化遗产从历史陈列品变成能参与当代文化建构的活态资源,实现价值的持续延续与创新发展。比如,中国移动创新研究院与浙江移动联合研发的具身智能导览机器人“小天”,已落地新昌博物馆“唐诗之路”展览。该机器人以 DeepSeek 大模型与自研多模态大模型为技术支撑,构建了针对性知识体系并完成专项训练,不仅能精准输出文物年代、工艺等核心信息,更通过融汇历史语境、活化文化内涵的方式,实现静态文物信息的场景化呈现与历史价值的活态阐释,直观印证了具身智能对文化遗产从静态陈列到动态价值再生的赋能逻辑。

三是实践逻辑。具身智能助力文化遗产保护,关键在于让保护模式从被动守护转变为公众主动参与。传统的文化遗产保护多由专业机构和人员主导,以被动守护和修复为主,公众大多只能旁观,很难真正参与进来。具身智能凭借技术特性打破专业门槛和时空限制,搭建起多样化的参与场景,让公众能够主动投身文化遗产保护工作。比如,公众能借助具身智能设备,参与传统技艺的模拟操作、文化遗产的数字化记录等工作,从单纯的价值感知者转变为主动的价值创造与保护实践者。这种保护模式的转变,既能提升公众对文化遗产保护的认同与责任意识,也能凝聚各方力量,形成全社会共同参与的保护氛围,让文化遗产保护工作更具持续性。全国第四次不可移动文物普查期间,海宁市文物保护所的实践案例直观印证了这一逻辑的可行性。该所通过遍布全市的政务航空无人机点位,远程对区域内的不可移动文物进行航拍, 完成航拍点位布设 400 余处。同时,还排查并消除了大运河相关隐患问题 100 余处,为大运河遗产后续管护争取了宝贵时间、提供了有力支撑,更为大运河遗产保护开辟了科技新路径。

二、具身智能赋能文化遗产保护的现实挑战

具身智能为文化遗产保护提供了创新的技术路径和实践方式,但在实际落地应用时,受技术发展阶段、文化认知深度、资源配置情况等多种因素影响,还没有形成成熟稳定的应用体系,面临不少现实挑战。这些挑战贯穿技术研发、应用适配、伦理规范到资源保障的整个过程,直接影响具身智能技术赋能作用的发挥,也在一定程度上制约了文化遗产保护目标的实现。

(一)技术应用的人文性缺失:过度侧重技术而弱化了文化意义

当前部分具身智能在文化遗产保护中的应用,存在明显过度侧重技术的倾向,陷入了重技术展示、轻文化内涵的认知偏差。技术研发和应用大多聚焦于交互形式的新颖度和技术参数的先进性,把技术本身的展示当成核心目标,却忽略了文化遗产保护的核心需求是传承文化意义、建立情感共鸣。这种过度技术化的倾向,让具身智能的应用变成了单纯的技术展示,难以深入挖掘文化遗产的核心价值。

过度依赖技术手段,还会导致文化意义的弱化和情感体验的缺失。文化遗产的意义生成,离不开人与遗产之间深度的情感联结和意义共鸣,而过度技术化的交互形式,会在人与遗产之间形成无形的技术隔阂,切断两者间的自然联系。如果具身智能只注重模拟感官刺激,不深入融入文化语境,体验者的认知就只能停留在表面的感官愉悦,无法深刻理解文化遗产的历史底蕴和精神内核。情感体验的弱化会进一步导致文化价值传递失效,让具身智能的赋能作用流于表面,难以实现文化传承的核心目标。

(二)适配性不足:技术与不同类型文化遗产的匹配难题

文化遗产类型丰富,不同类型遗产的存在形式、保护需求和传承方式差异明显。物质文化遗产的保护重点是实体保存与历史信息还原,其核心诉求集中在实体状态监测、修复辅助以及历史场景的再现;非物质文化遗产以技艺、习俗、表演等活态形式存在,保护的关键在于技艺传承、流程展示和参与式体验的搭建。静态文化遗产需要稳定的感知交互场景来呈现历史原貌,动态文化遗产则要求交互形式具备灵活性和实时性,以匹配自身动态变化的特点。

图为皮影戏表演。(图片由 AI 生成)

当前具身智能技术在适配不同类型文化遗产时,普遍存在针对性不足、个性化缺失的问题。现有技术方案多采用标准化开发思路,缺少对不同类型文化遗产特性的深入调研,也缺乏精准的适配设计。缺乏个性化适配的技术应用,不仅难以充分释放具身智能的技术优势,还可能因技术与遗产特性冲突,干扰文化遗产的原有形态和核心价值。

(三)伦理与安全风险:数据隐私泄露与文化主权争议

具身智能的应用离不开用户数据的收集和分析,这一过程中隐藏着数据隐私泄露风险。具身智能通过感知设备捕捉用户的动作、表情、生理反应等多维度数据,以此实现精准的交互适配。这些数据包含大量个人隐私信息,如果缺乏完善的数据安全保障体系,很容易出现数据泄露、滥用或非法交易的情况。现有的数据保护机制大多是针对传统互联网场景设计的,很难适配具身智能多模态数据收集的特点,再加上数据收集的边界不清晰、数据存储的安全防护不到位、数据使用的权限管理缺失等问题,进一步加大了数据隐私保护的难度。

在跨文化传播场景中,具身智能还可能带来文化误解、侵犯文化主权等伦理风险。具身智能对文化遗产的解读与呈现,很大程度上受研发人员文化认知的影响。如果研发人员对不同文化背景缺乏深入了解,在提取文化元素、搭建相关场景时很容易出现偏差和疏漏,导致文化信息被误读、扭曲,最终造成跨文化误解。更严重的是,部分应用可能会不当解构甚至商业化滥用小众或弱势文化遗产,无视这些文化遗产所属群体的文化主权与自主意愿,违背了文化平等与尊重的基本伦理,还会对文化多样性保护产生不利影响。

三、具身智能赋能文化遗产保护的实践路径

针对具身智能赋能文化遗产保护过程中存在的现实挑战,需立足文化遗产保护的核心目标,以问题为导向构建系统性的实践路径优化体系。优化路径应坚守人文本位的核心原则,实现技术应用与文化需求的精准适配,筑牢伦理与安全防线,推动具身智能在文化遗产保护领域的规范化、深度化应用,真正发挥技术赋能文化传承的核心价值。

(一)坚守人文本位,构建技术赋能的价值导向

一是确立文化核心地位,以文化内涵解读为技术应用的出发点。在文化遗产保护中,具身智能技术的研发与应用应将文化遗产的核心价值与内涵解读作为首要前提。技术的选择、交互形式的设计均需围绕文化意义的传递展开,避免技术的盲目应用与过度展示。技术研发应跳出技术中心主义,以文化遗产保护的实际需求为导向,实现技术服务于文化传承的核心目标。构建文化遗产专家与技术研发人员的协同机制,是保障技术应用文化准确性的关键。应建立常态化的协同工作模式,让文化遗产专家深度参与技术研发的全流程,从文化内涵解读、价值挖掘到应用场景设计,为技术研发提供专业的文化指导。技术研发人员则需精准把握文化遗产专家的需求表述,将文化需求转化为可行的技术方案。通过双向协同实现技术逻辑与文化逻辑的深度融合,确保具身智能的应用能够精准传递文化遗产的核心价值,避免文化信息的偏差与失真。

二是强化情感体验与意义建构,提升用户的文化共鸣。加强用户与文化遗产之间的情感连接,是具身智能助力文化遗产保护的重要目标。这需要通过场景化设计和互动式体验,打造沉浸式的文化感知环境。场景化设计要重视文化语境的还原,把文化遗产放到原本的历史情境和文化背景中呈现,让用户通过身体的感知与互动深度融入场景,形成对文化遗产的直观认知和情感触动。互动式体验的设计要兼顾感知的丰富性和意义的关联性,引导用户主动参与文化意义的探索,而不是被动接收信息。结合叙事学理论构建文化遗产的历史叙事,是帮助用户完成意义建构的有效方式。具身智能可以借助多模态交互技术,把文化遗产承载的历史信息转化为连贯的叙事内容,通过用户的身体动作参与推动叙事展开。叙事内容的构建要注重历史逻辑与文化逻辑的统一,突出文化遗产的历史脉络和精神内核。用户在参与叙事的过程中,能逐步深化对文化遗产意义的理解,实现从感官体验到情感共鸣再到意义认同的逐步提升,从而真正让文化遗产的价值有效传递下去。

(二)做好精准适配,实施针对不同类型文化遗产的技术应用策略

针对物质文化遗产,尤其是古建筑、文物遗址等物质文化遗产的特性,具身智能的应用应聚焦可视化解读、虚拟修复与风险预警三大核心方向。一是在可视化解读方面,可通过三维建模、空间可视化等技术实现文化资源的立体化呈现,还可结合文化遗产深度价值分析与历史脉络解读,推出沉浸式游览与互动体验场景。二是在虚拟修复方面,通过动作捕捉与 3D 建模技术的结合,实现文物的虚拟修复与交互展示。通过动作捕捉技术精准记录文物的现存状态,借助 3D 建模技术构建文物的数字化模型,在虚拟环境中模拟修复过程,为实体修复提供精准的数据支撑与方案参考。同时,虚拟修复后的文物可通过交互展示让用户直观对比修复前后的差异,深入了解文物修复的技术原理与文化意义。三是在风险预警方面,结合传感器技术构建的实时风险预警系统,可实现对物质文化遗产保存环境、结构状态的实时监测,及时发现潜在的安全风险并发出预警,为物质文化遗产的实体保护提供技术保障。

针对非物质文化遗产,尤其是传统技艺、民俗文化等需要活态传承的类型,具身智能应用要围绕三个关键方向展开:沉浸式学习、活态传承与创新传播。利用动作捕捉技术搭建技艺模拟学习系统,精准记录非遗传承人的动作细节与技艺核心,建立规范的技艺动作数据库。用户通过具身智能设备进行动作交互,沉浸式模仿学习非遗技艺,掌握操作要领、感受文化内涵,既降低了非遗技艺的学习难度,也扩大了传承群体。搭建虚拟民俗体验平台,能让非遗突破时空限制传播。通过场景建模和多模态交互技术,还原民俗活动的举办场景、流程环节与文化氛围。用户可以亲身参与民俗活动的核心环节,直观感受民俗文化的独特魅力。此外,借助具身智能推动非遗与现代生活融合创新,还能挖掘非遗文化的核心元素,结合现代生活需求设计互动体验内容,实现非遗文化的当代转化。这样的创新传播方式能让非遗文化真正融入现代社会,增强其生命力与影响力,助力非遗活态传承持续推进。

(三)风险规避:建立伦理规范与保障机制

一是制定技术应用的伦理准则,明确人文边界。相关部门与行业协会应联合制定具身智能赋能文化遗产保护的专项伦理准则,明确技术应用的范围、方式与人文边界。伦理准则应立足文化平等与尊重的核心原则,规范文化元素的提取、场景的构建与传播方式,避免对文化遗产的不当解构与扭曲。准则需强调尊重文化多样性与文化主权,充分尊重文化遗产所属群体的意愿与诉求,保障其在文化遗产保护与传播过程中的主导权。建立伦理审查机制是准则落地的重要保障。在具身智能应用项目立项、研发与落地的各个阶段,引入伦理审查环节,由跨领域的伦理专家、文化专家组成伦理审查团队,对项目的文化适配性、伦理合规性进行全面评估。对可能存在文化误解、侵权风险的项目及时提出整改或终止意见。通过伦理准则与审查机制的双重保障,引导具身智能技术在文化遗产保护领域的规范化应用,规避伦理风险。

二是完善数据安全与隐私保护机制。搭建覆盖全流程的数据安全与隐私保护机制,是具身智能落地应用的重要前提。要制定规范的用户数据收集和使用流程,明确数据收集的范围和目的,遵循最小必要的收集原则,避免过度采集用户信息。强化数据加密技术的使用,对收集到的用户数据进行全程加密,确保数据在存储和传输过程中的安全。建立严格的数据权限管理体系,厘清数据使用的权限边界,防止数据被滥用或非法泄露。厘清数据所有权和使用权的归属,是保障用户隐私权益的核心。要通过法律条款和行业规范明确用户对自身数据的所有权,还要明确技术应用方仅能在约定范围内拥有使用权。建立数据使用的告知与授权流程,在收集用户数据前,充分告知用户数据的使用范围、方式和期限,获得用户的明确同意。同时,搭建数据安全应急响应机制,针对数据泄露等突发情况制定应急预案,及时采取补救措施,保障用户的合法权益。

参考文献

[1]杨凡 . 数字文旅,赋能人才培养[J].人力资源,2024,(03):34-36.

[2]嘎拉森 , 裴佳杰 . 数智时代文化遗产保护的风险治理 [J]. 文化遗产 ,2025,(03):60- 67.

[3]聂静虹 , 李肖楠 . 数字化赋能文化遗产保护的方法逻辑和创新路径 [J]. 学术研究 ,2025,(05):91-96.

[4]裴璇 , 康宽 , 刘宇 , 等 . 数字经济与实体经济融合:价值意蕴与特征识别 [J]. 统计与决策,2025,41(20):5-10.

[5]康宽 , 裴璇 , 聂兴凯 . 数字时代 空间均衡:新型信息基础设施的水平测度与时空跃迁 [J/OL]. 财经理论研究 ,1- 15[2026-01-08].https://doi.org/10.13894/j.cnki.jfet.20251020.002.

[6]万诗婕 , 裴璇 , 许默焓 , 等 . 数实 融合对企业 ESG 表现的影响——来自中国数据要素市场化建设的证据 [J/OL]. 成都理工大学学报 ( 社会科学版 ),1-14[2026- 01-08].https://link.cnki.net/urlid/51.1641. c.20251020.1502.002.

[7]裴璇 , 刘宇 , 王稳华 . 企业数字化转型:驱动因素、经济效应与策略选择 [J]. 改革 ,2023,(05):124-137.

【本文系 2023 年度辽宁省社会科学规划基金项目(L23CDJ004)“辽宁革命文物数字化保护利用研究”的阶段性研究成果】

【宋天含系辽宁社会科学院哲学所助理研究员; 刘保山系北大国土空间规划设计研究院(北京)有限责任公司副总规划师、高级工程师,国际古迹遗址理事会(ICOMOS)国际会员、ICOMOS  CHINA数字遗产专委会委员;裴璇系对外经济贸易大学商业伦理与社会责任研究中心研究员,系本文通讯作者】

评论被关闭。