数据的经济特性、竞争效应及治理政策

0

 马 源 路嘉明 方 燕

 当今时代,数字化转型快速推进,线上线下深度融合,带动数据量保持指数级增长。借助算法分析数据资源、优化商业策略、提升经济效率,已成为商业常态,数据作为生产要素和战略性资源的地位日益凸显。在这种背景下,各方围绕数据的争夺升温,引发了人们对垄断数据资源、滥用数据优势、实施垄断行为等问题的担忧。要理解数据在市场竞争中扮演的角色,就必须深刻理解数据的经济特征,全面分析数据会如何影响市场竞争,洞察国内外最新执法立法趋势,进而立足释放数据要素价值,促进数字市场竞争,提出进一步完善数据治理规则的政策思路和建议。

一、数据是新型生产要素,需要深刻认识其经济特性

在传感器技术(数据采集)、信息网络技术(数据传输)、数据存储技术(数据存储)、先进计算技术(数据分析)等技术快速进步下,与数据处理全流程相关的技术成本大幅下降,一大批“数据驱动创新”(Data-Driven Innovation)型业务应运而生,数据也因此成为数字时代的新型生产要素、无形知识资本和战略性必争资源。

(一)数据仅是客观记录,只有被开发利用才能带来经济价值 

数据只是对客观事物的性质、状态以及相互关系等进行记载的符号组合。在数字化时代,数据以“0”或“1”的二进制字符串存储在磁盘、硬盘、光盘等存储介质上,如果没有对应的数据编码规则,这些“0”或“1”的字符串并没有特定含义。但是,数据一旦被定义或编码,例如与物理世界的人类、市场主体、自然环境等具体事物、对象或应用场景一一对应起来、关联起来,就会被赋予特定内涵,就会蕴含“信息”。再进一步,深入挖掘“信息”背后的事物规律、发展趋势或深刻洞见,就可以提炼升华得到“知识”。按照经合组织的观点,如果只拥有海量数据,而没有数据挖掘、分析和萃取提炼能力,则会形成“信息过载”;只有当数据被转化为信息或知识,并辅助预测、支撑决策或指导实践之后,才能释放出其蕴含的潜在经济社会价值。

数据开发利用在经济社会发展中的作用日益突出。随着智能手机的广泛普及,机器人、传感器在各行业的规模化部署,数据量积累越来越大。从微观层面看,通过整合来自各方面的数据,市场主体可对客户进行更加精准的“画像”、洞察其行为特征和需求偏好,提供更具个性化的营销方案、更加定制化的产品和服务,从而进一步增强吸引力和竞争力,形成“正向反馈”。从中观层面看,各类平台企业汇聚起海量的市场主体经营数据,例如电子商务平台汇聚了入驻商户的高频经营数据,就可以实时感知行业态势、市场冷暖;工业互联网平台汇聚了产业链上下游生产供销数据,就可以推动制造业和服务业的深度融合,发展协同化设计、远程交付和预测性维护等新兴生产性服务业。从宏观层面看,大数据与实体经济的深度融合,衍生出一大批数据采集、清洗、建模等新兴增长点,提升了全要素生产率,是实现经济高质量发展的关键驱动力之一。

(二)数据具有非稀缺性、非竞争性、非排他性,可重复采集

与传统生产要素如土地、资本等具有稀缺性相比,数据要素的最大区别在于它不是稀缺的。包括手机、智能可穿戴设备等在内的消费终端设备以及机器人、生产线等工业装备,都开始具备采集和处理数据的能力。只要消费者开始使用智能终端、浏览各类业务,自然就会产生用户注册数据、上网痕迹数据、支付交易数据等,并存在终端上、沉淀在平台企业的大数据中心上。同理,只要数字化的联网装备开机运行,就会不停地产生装备状态数据、生产进度数据、故障报警数据、采购销售数据等。从统计来看,全球数据量每年增长27%左右,或者说每4年新增加的数据量,都会超过人类有史以来积累的数据量总和。近年来,多国政府还免费开放了大量公共数据,这些数据可被各方下载和开发利用。从这个意义上讲,很多数据都是非竞争性、非排他性的,某些数据被某个市场主体采集后,无法阻止其他主体采集类似数据,只要符合法律规定就可以。

(三)数据不是规模报酬严格递增的,不同来源的异质性数据往往更有价值

数据所蕴含的信息价值,既与数据总量有关,更与数据来源的多样性、互补性有关。以推断消费者的需求偏好为例(目的是精准投放广告),在算法给定的情况下,增加样本数据规模,的确有助于更加精准地刻画出用户消费习惯,但样本数据量的进一步增加,对于分析用户消费习惯的边际贡献越来越小。以搜索引擎业务为例,勒纳(Lerner)研究发现,当用户输入搜索关键词时,搜索引擎企业会匹配返回多页搜索结果,但只有用户实际点击的那些记录才更有价值,因为这有助于了解用户诉求,改善广告定向投放的精准度,不过,用户搜索记录增加带来的边际改善却不断下降。相比单一性的数据量增长,来源多样化的数据可揭示出更加丰富、更多维度的高价值信息,即数据的范围经济效应要更为明显一些。例如,身份数据能反映个人特征,位置数据能反映消费者所处地点,支付数据能反映交易金额,将这些数据汇总起来形成用户数据“档案”,平台企业可更全面了解用户,进而优化市场策略或促销计划,加快向相邻市场拓展。

(四)数据在功能上不是高度差异化的,来源不同的数据可以相互替代

用户在使用互联网服务过程中,时刻“留下”自己偏好方面的“蛛丝马迹”,这些数据并不是高度差异化的。一方面,不同市场主体掌握的用户数据很多是相同的。例如,用户要使用网络服务,就需要向宽带企业提供用户身份、联系地址、上网日志等信息;要使用平台服务,就需要下载注册对应的移动应用程序(App),这些App运营企业自然就掌握了用户身份、地理位置、上网终端、App记录等数据。显然,各家掌握的用户数据大同小异,区别仅在于各自的用户规模和数据量大小不同而已。另一方面,不同平台掌握的用户数据似乎迥然不同,但在“用户画像”方面,却是高度趋同的。Graef(2015)发现借助用户搜索记录“交叉复现”特定用户群体的音乐偏好结果,与利用社交记录揭示出的音乐偏好结果基本相同。这意味着使用不同数据也可实现相同功能。Lerner(2014)发现在提升广告精准化方面,亚马逊收集到的用户购物记录数据与谷歌拥有的搜索记录一样高效。简言之,从商业目的来讲,不同数据源可以提供几乎相同的洞见,至少在功能上是具有潜在替代性的。

(五)数据是具有时效性的,其蕴含的经济价值往往随时间快速贬值

数据是可以长期存储的,但蕴含的经济价值不是一成不变的,而是快速贬值的,因为数据只是记录了历史,在瞬息万变的世界里,历史数据对当下的商业决策价值有限。数据贬值的速度主要取决于数据类型、用途和具体业务场景。Statista对谷歌广告数据研究发现,那些仍未经加工的原始数据中,有70%的数据超过90天就会过时。据谷歌披露,用户每天搜索的关键词、搜索结果记录中,有15%是新出现的,这就要求滚动纳入这些最新的搜索记录,唯此才能贴合当下用户关切的搜索需求。比如,用户毕业前的消费记录只反映了就学期间的购物偏好,一旦工作上岗,再利用之前的数据来定向促销,其精准性就大打折扣。鉴于新模式新业态层出不穷,用户喜好快速变化,历史数据在科学研究方面或许有价值,但在指导即时决策方面的价值,往往要比预期低很多。从这个意义上讲,在位者即便积累或垄断了海量数据,其优势也是有时限的,难以长期保持。

(六)数据既不是决定企业成败的充分条件,也不是必要条件,重要的是要提高数据分析处理能力

数据只是一种生产要素,要释放数据价值,就必须与劳动、资本、技术等其他要素相结合。纵观国际上一流平台企业的成长历程,绝佳的商业创意、天才的工程师团队、优秀的算法以及对消费者痛点的洞察等,都是关键影响因素,其重要性甚至要比数据更高。一方面,有数据优势的企业不一定就具备竞争优势。例如,在位电子商务平台吸引了海量用户和店家,积累了丰富数据,然而社交电商、直播电商、跨境电商等新进入者的挑战,使其市场份额正在被侵蚀。在网络效应极强的社交应用上,Myspace 虽积累了海量数据、先发优势突出,脸谱(Facebook)却后来居上。另一方面,没有数据,也不一定就处于先天劣势。一些初创企业拥有绝佳的创意,诸如在线预约出租车、在线点餐、视频社交等,其App一经推出,就受到用户青睐,迅速沉淀起海量数据。总之,企业拥有数据只是具备了潜在优势,但能否转换为市场优势,还要看与管理、投资、劳动、技术等其他要素配置效率的高低。

二、数据通过多个途径影响市场竞争,日益成为平台反垄断和促进公平竞争关注的关键因素

数据可助力平台企业更好地了解客户需求、优化服务,提升效率。但平台企业一旦拥有了数据优势,就有能力、有动力将数据资源作为巩固其主导地位的工具,甚至滥用数据优势来排斥或限制竞争、损害社会福利,这是政策关注的重点领域。

(一)数据有助于抬高市场准入壁垒,巩固领先平台的垄断地位 

进入数字时代,谁掌握的用户数据量越大、维度越丰富,谁就能更全面地了解用户偏好、刻画用户特征,向用户提供更具个性化、差异化的产品或服务,谁的吸引力和竞争力就更强。这里存在一个“自我强化”效应,即匹配越精准、服务质量越高,就越能吸引新顾客;反过来,吸引的用户量越大,通过“干中学”算法优化就越快,用户就越离不开,市场地位也就越牢固。平台企业普遍渴求拥有更多数据,在实践中,当用户注册使用平台服务时,平台往往把允许采集数据作为使用其在线服务的前提条件,变相强迫用户默认同意其服务协议。同时,还通过并购目标企业或购买第三方数据,来获取大量自身并不拥有的数据资源,以更全面地洞察客户需求,增强用户黏性。再加上规模经济、网络效应和声誉机制等的共同作用,领先平台企业就比较容易地打造起一个以自身平台为主导的、横跨多个领域的庞大数字生态系统;对于竞争对手而言,进入壁垒就进一步抬高了。

(二)数据可助力领先平台识别和预警潜在威胁,采取“先发制人”的并购策略来扼杀未来竞争

平台企业掌握的数据越多,就越有条件扭曲市场,将竞争对手消灭于萌芽之中。简单来讲,掌握平台入口的在位企业可利用各种实时数据,来监控所在市场最新发展态势,跟踪各潜在对手成长状况(包括用户数、在线时长、成长速度等),及时生成优质情报数据,一旦识别出某个新进入者对自身地位威胁程度较高,就会先行一步,有针对性地并购新进入者,“收编”到自己旗下;如果后者不同意“收编”,则马上复制出一款类似的服务,并给予资金、营销等全方位支持,来击垮实力薄弱、尚处于创业期的新进入者。美国脸谱在收购Instagram之前,就使用内部数据跟踪其增长情况;2013年在收购虚拟专用网提供商Onavo时,意图就是将其用作“预警系统”,例如监测Snapchat的用户数变化情况,并制定“反Snapchat”策略。前几年,国内互联网领域的主动或被动“站队”现象也是类似逻辑。这种针对新进入者的排他性“扼杀式”并购行为,虽然为创业者提供了退出渠道,但负作用是将新进入者颠覆在位者的机会消灭于萌芽状态,损害了动态竞争效率。

(三)数据可助力领先平台实施拒绝交易、自我优待等行为,排挤或限制竞争对手

随着数据日益集中在少数平台手中,利用数据优势来排挤或限制竞争开始成为一个关注重点。一方面,拥有数据优势的平台企业可能实施拒绝交易行为。特别是那些占有唯一性、独特性数据的平台企业,如果拒绝向竞争对手或下游企业提供此类数据,则被“断供”的企业就无法生存;但也有观点认为,平台企业收集开发数据投入了大量成本,如果政府部门强制要求平台企业开放API接口或共享其数据,势必会打击平台企业收集开发数据的积极性,或者说平台企业出于经济回报考虑拒绝交易也有其合理性一面。另一方面,还可能实施自我优待行为。即通过平台上的数据感知到竞争对手更受欢迎时,为了卡住对手阻止其扩张,一边降低对手的搜索排名、不再给予流量支持,另一边却给予己方旗下的商品或服务以优惠支持。厚此薄彼,这是平台企业的惯用行为。例如,当用户搜索视频时,谷歌基于用户偏好数据,优先靠前展示自家视频内容,即使对手的视频服务更优、选择更多。这种偏袒行为提高了进入壁垒,限制了市场内竞争。

(四)数据增强平台运营能力,可能造成“大数据杀熟”、降低服务质量等现象,损害消费者权益

拥有海量数据的平台企业在面对消费者时,可能处于优势议价地位,甚至实施剥削性滥用行为,类似的策略五花八门。主要包括以下几种:一是捆绑销售,将平台新功能、新服务以捆绑甚至搭售的方式,套装推送给用户,限制或剥夺消费者选择权。二是“大数据杀熟”。通过算法自动分析用户偏好和支付能力,对消费群体精准分组,并采取动态的、差异化和个性化定价策略,将消费者剩余转化为垄断利润,涉嫌侵害消费者知情权。三是降低服务质量。原则上,拥有海量的用户数据可让平台企业有能力进一步优化服务,更好地服务客户,但在市场垄断、竞争受限的情形下,领先平台往往就会放缓创新,缺乏改进服务的动力,甚至可能牺牲消费者利益,如过度推送广告、误导消费选择等。四是合谋操纵价格。网上公开的服务价格、质量评价和信用诚信等数据,虽然提升了透明度,但平台也可借助算法自动监测价格变化,进而增加了心照不宣、协同行动、默契合谋的可能性。

(五)数据往往内嵌了大量个人信息,隐私保护成为新的关注点 

平台企业在提供日常服务方面的作用越来越大,用户为了使用服务,只能接受格式化的、冗长的、晦涩难懂的服务协议,这样一来,平台企业就能收集更多数据。对于非专业的普通消费者而言,很难知悉哪些数据被收集了,又是如何被使用了,往往在出现用户数据大规模泄露事件后方才知晓。特别是,平台企业还善于使用“暗模式”(Dark Patterns),即在用户界面故意混淆用户选择,使其默认接受而非拒绝平台协议。关于是否应该将隐私保护纳入反垄断政策视野,有学者认为将隐私因素纳入竞争分析可能存在障碍,例如破坏了竞争法体系的一致性,也有学者主张反垄断制度已经认同了非价格竞争(如品牌、质量竞争)的重要性,隐私保护就是非价格竞争的一种新形式,原则上也可纳入反垄断框架下予以考虑。否则,平台企业就会疏于保护个人信息,加剧数据滥用,甚至走向毫无底线的竞次竞争。

三、立足释放数据价值,进一步完善数据治理规则

数据是数字时代的生产要素和关键资源,要释放数据价值关键在于深刻认识数据在竞争中的不同作用,健全数据治理规则,激励数据采集和开发利用,防范数据集中引致的滥用行为,完善多部门协同监管机制。

(一)区分数据的多重角色及竞争效应,宜实施分类治理 

数据在不同语境下具有不同的角色,从功能用途上看主要区分为三种情形,不宜混同处理。首先是要素意义上的数据,各类主体在不同场景下,普遍都采集存储了大量原始数据,如注册数据、交易数据、行为数据等,这些数据源源不断产生,可被重复采集,很难被独占,基本不存在垄断问题,政策导向是鼓励依法采集生产。其次是产品或服务意义上的数据,即数据持有者投入人力、算力和算法,对原始数据进行深度开发后形成有价值的衍生数据,这些数据富含创造性活动,可以产品形态销售给客户,此时就存在一个数据产品市场。一旦出现占据较大市场份额的垄断企业,该相关市场虽然是高度集中的,但此时的政策导向应当仍是鼓励其做优产品、做大做强。最后是竞争政策意义上的数据垄断行为,即数据持有者基于其拥有的数据要素或数据产品优势,采取了策略性的滥用行为,来抬高市场进入门槛,巩固自身地位,排斥或限制市场竞争。此时的政策关注点是通过反垄断来恢复市场竞争秩序。简言之,数据因不同语境而存在巨大差别,要区别对待、分类治理。

(二)规范数据采集规则,防范可能抑制竞争的数据驱动型经营者集中行为

数据集中是数据价值得以实现的内在要求,也只有把不同数据整合起来,才能孕育数据驱动的新业态,但大量数据过度集中可能引发数据垄断问题。要防范这一问题,关键是针对数据形成和集中的过程设定规则。首先要从源头上规范采集规则。平台企业有很强动力去收集一切数据,例如设计复杂的隐私条款或“暗模式”,采集超出其业务运营所需的数据类型,并将其广泛应用到其他场景下。要遏制这些行为,关键在于细化法律法规和个人信息保护标准,包括落实个人信息采集使用主体须遵循合法、正当、必要原则,公开收集、使用规则,明示收集、使用的目的、方式和范围,落实主动删除义务等。其次要防范以获取数据为目的的经营者集中行为。数据是决定企业估值的关键资产,平台企业之所以并购目标企业,动机之一就是获取其数据资源,再通过数据集中、数据整合提升竞争优势。对此,要有前瞻性防范意识,强化经营者集中审查,包括排查数据特征,如是否具有唯一性,评估数据集中的潜在竞争影响,警惕利用数据优势来排斥横向市场的竞争对手,或者依赖数据资源的上下游企业;同时依法要求整合利用数据时,不得违反采集个人信息时用于特定目的约定。

(三)加快数据市场基础制度建设,激励平台企业以开放共享释放数据价值

数据的价值在于开发利用,让数据动起来,而不是垄断起来、禁锢起来。要打破数据垄断局面,关键是推进数据流动、共享利用。首先要从消费者侧着眼,从根源上保障数据可携带权、迁移权和遗忘权切实落地生效,降低消费者跨平台迁移成本。例如,让消费者把之前在A平台上积累的个人数据档案,便捷地批量转移到B平台上,为此平台企业要修订服务协议,将上述用户权利纳入其中,同时可推动制定数据兼容或互操作性标准,确保技术上可行,而不是以接口不兼容来敷衍或拒绝。其次要从平台侧着眼,激励平台企业主动参与到数据流通和共享活动中去,关键是加快建立数据市场基础制度,包括基于场景的市场化交易流转制度,促进数据交易中介如数据银行、数据信托等业态发展,培育数据要素市场,让可交易的数据越来越丰富。再次要强化“守门人”平台的数据公平共享义务。入驻“守门人”平台的各类主体,高度依赖平台提供的流量、数据等资源,数据断供犹如“卡脖子”,对此要推动平台数据的公平接入,增强数据接入规则的透明度。最后要大力推动政府数据开放,制定数据开放战略,编制数据开放目录,制定以免费为主、授权开放为辅的开放规则,丰富高质量数据供给,让各类主体进行增值开发和再利用。

(四)强化反垄断和反不正当竞争介入,防范滥用数据优势排斥竞争和侵害消费者权益

数据可助力巩固平台垄断地位,平台也可能滥用数据优势破坏市场竞争秩序。恢复市场有效竞争的一个关键救济举措就是反垄断和反不正当竞争,但要充分考虑数据类型、应用场景、服务协议以及平台市场地位等因素,采取逐案分析思路。在防范排挤限制竞争方面,对于经营者集中案件,要关注双方集中完成后,拒绝向第三方提供数据的可能性,用好附条件批准手段,要求双方事前作出一定时期内公平开放数据的承诺;对于涉嫌利用数据实施滥用行为,要关注拒绝提供数据来排斥竞争对手,或者关闭上下游市场的可能性及潜在影响;还要关注实施自我优待、杠杆传导效应,来打压竞争对手的行为。需要提醒的是,这类行为有反竞争的一面,但也有其正当性,需要全面评估,很难一概而论。对于涉嫌利用数据侵害消费者权益的行为,包括“大数据杀熟”、强制捆绑推广、误导选择、默契合谋等可能涉嫌不公平待遇、损害知情权甚至具有欺骗性、剥削性等行为,要抓住算法这个关键点,强化算法的形式监管和实质监管,包括算法风险自我评估、透明度要求及算法认证等,促进算法中立和企业主动合规。

(五)健全多部门协同监管机制,统筹兼顾促进竞争和强化个人数据保护

数据虽蕴含经济价值,但也牵涉个人信息及数据安全,必须统筹兼顾,不可偏废其一。当下,平台企业采集的高价值数据往往都会富含个人信息,例如身份数据、生物数据如刷脸数据,还有行为数据如地理位置等敏感数据,即便不完全包括这些数据,平台企业也可利用大数据技术反向推断出个人身份信息。这些数据一旦泄露或被滥用,肯定会削弱人们参与数字经济的信心。从反垄断视角看,反垄断部门的职责是关注数据集中或垄断行为对市场竞争、社会福利、创新等方面的影响,并不去关注是否侵犯了个人隐私、滥用了个人数据,或者说与数据保护监管是相脱节的。对比之下,个人信息保护部门的职责则是保障数据被知情、安全地收集、存储和分析使用。两者各司其职,就可能存在畸重畸轻或监管碎片化问题。美欧反垄断机构在执法时,通过发送提醒函或告知书等方式,提请其他部门关注潜在的个人数据保护、消费者权益保护等问题,就是一种协同机制。在这方面,要统筹兼顾、协调行动,充分发挥国家数字经济发展部际联席会议制度作用,平衡好数据保护和开发利用,让数据在可信任的制度下最大限度地释放其价值。

(作者马源系国务院发展研究中心企业研究所副所长、研究员,路嘉明系中国人民大学经济学院博士研究生,方燕系浙江省北大信息技术高等研究院研究员。本文节选自国务院发展研究中心研究丛书2022——《数字平台的发展与治理》,中国发展出版社2023年7月第1版,发表时略有删减。) 

评论被关闭。