朱民:迎接数据资本大时代的到来
-
2024-05-21
来源: 清华金融评论
第四产业的崛起
第四产业是智能产业,即数据加人工智能(AI)。数字经济有狭义和广义之分。狭义数字经济是纯粹的数据产业、智能产业;广义数字经济是数字化的制造业、服务业、农业等,被赋能的原有三大产业,可称之为广义数字产业。
第四产业与人工智能
狭义数字产业就是第四产业,这个产业发展迅猛,是当前遇到的最重要课题。也只有在如此大的背景下,我们才能看到数据的未来和数据业的发展。人类正在离开信息时代,进入智能时代。信息时代是应用先行,人们可以在任何地点、任何时间几乎零成本地获取信息,在信息时代,数据的使用者、决策者是人,信息是副产品,是软件优先。但是进入智能时代,特别是进入以生成式预训练(GPT)为代表的AI 2.0以来,信息被机器和计算机程序使用的频率呈增长趋势,数据让机器智能化,而智能化的系统能处理更多的数据,因此数据优先、数据先行是智能时代的根本性特征。
因此,在人类智能之外产生了一个新的智能——人工智能,它以数据为起点。人的智能以观察为起点,比如牛顿观察树上的苹果,发现苹果会掉下来,由此发现了万有引力。观察会走向科学,人们从观察中学到技术,利用技术生产产品。但是在人工智能时代,数据是起点,数据直接产生知识,进而生产产品,这样又将产生数据并进行迭代,重新回到数据,如此就形成了一个闭环。人工智能时代的运行路径短,闭环效率高。
这是人类有史以来第一次找到第二个知识获取的平行途径——机器认知,这是以数据为支持的,而且机器认知不一定与人类智能重合,机器认知可能会扩大知识的绝对空间,这一点非常关键。这赋予了数据新的、超越性的职责和地位。而从数据到服务社会的路径可以变得更短、更有效,原因在于人工智能本身可以形成闭环。数据与知识是事物的一体两面,数据是知识的载体,数据流通就是知识流通,这是理解智能时代与数据地位的重要框架。
人工智能经历了从以模型为中心到以数据为中心的转变。人工智能1.0时代以模型和编程为中心,主要是编程序;人工智能2.0时代以数据为中心,模型可以相对固定,主要关注数据的定义、管理、切割、扩充、增加、修正等,这使得数据成为主要的投入、校准、学习对象,数据变得越来越智能化,这是一个重大的变化。GPT的发展再次确认,未来世界将构建在数据的基础上, GPT的核心是基础模型(Foundation Model),未来可以产生众多功能,包括制作图像、写作、管理、分析等。但基础模型的起点是数据,各种各样的数据。
在人工智能时代,数字化技术要数据先行,设计开发需要小批量数据,训练需要大量的结构化数据,评测需要标准数据,仿真需要场景构建的数据库,迭代需要持续的数据输入来进行算法的迭代,整个过程都是数据过程。从这个意义上说,未来科技的核心是数据科技,这将催生基础数据的服务业,即数据产业。
与此同时,数据的规模也变得越来越重要,对于GPT而言,最关键的是涌现能力,而涌现需要足够丰富的数据、数据的表征、数据的交互。在数据量小的情况下,GPT是一个线性的过程,在涌现的时候,GPT可以呈现曲线的发展,并会产生新的想法,这就是GPT能够迅速获得发展的重要特征,因为它能产生一种新的智能。很明显,小量的数据没法产生涌现,大规模的数据、数据的表征和交互变得越来越重要,因此这就需要数据的产业化来满足上述要求。
科研的第四范式
科研正在进入第四范式,即数据领先和主导的科研模式。随着大量数据的产生,科研进入数据密集型的第四范式。1998年图灵奖获得者吉姆·格雷,把第四范式归纳成科学方法革命的范式转换。传统的科学研究方法有三种,第一类是通过实验归纳,第二类是模型推演,第三类是仿真。新的第四类就是数据密集型的科学发现,通过大量的数据进行推演和预测。在第四范式下,使用数据最多的是物质,比如预测已知蛋白的结构,目前已知的人类蛋白质有2亿种,其中的100万种已经勾勒出三维(3D)结构。人可以数字化,表明数字是起点。
以数据为基础的大模型科研前景非常广阔,包括生命科学领域的药物研发、合成生物学,材料科学领域的金属材料、高分子材料、陶瓷和无机材料,能源领域的石化能源、电池、新能源、核能、热能,电子工程领域的半导体材料、信息储存,地质和环境科学等。以前的科学研究都是从理论开始,逐渐地往外延伸,现在以数据为基础的科研第四范式,是通过大数据来倒推科学的核心与原理,前景非常广阔。可以认为数据是科学研究的基础,这是颠覆性的。
数据是物理世界运营和优化的基础。核聚变中的托卡马克装置的核心,是让等离子在运转过程中不能碰到其内壁,一碰到内壁等离子就会出现衰退。等离子是没法控制的,可以通过数据用人工智能来控制内壁,使得磁圈不断地发生变动,使得等离子不会碰到内壁。举例而言,这好比让一个喝醉酒的人,尽管摇摇晃晃,但不会碰到墙,不是控制这个人,因为醉酒的人没法控制,而是让墙不断地移动,这就是通过数据来实现的结果。
制造业领域,可以通过数据将实体制造层,到云平台的运营技术(OT)、信息技术(IT),垂直地进行打通。以前打通制造层相当困难,现在可以把制造层和OT、IT层打通,和财务层打通,和供应链打通,从而实现零库存,进而对销售、零售、产品造成影响。在生产的过程中,数据不断产生新的产品设计和工艺设计,从而实现完全数字化的过程,这些都是以数据为基础的。服务业领域,ChatGPT通过插件(Plugins)构成新的生态,将智能与网络广泛连接,超级应用生态正在形成。平台数据与GPT数据不断交互、重叠、学习、反馈,从而使得新的数据服务生态越来越好。
第四产业时代的崛起
新的第四产业时代正在崛起,这个产业就是智能产业,即数据加AI产业。传统意义上的三大产业分别为农业、工业和服务业。农业是以自然物质为基础的产业,需要土壤和阳光。作为传统第一产业的农业,占经济的总比重较低,而且会逐渐消失,原因在于,只要电价足够低,农业将成为城市农业、大棚农业,这些事情正在发生。工业是对物质的再加工,服务业是服务工业、服务人、服务社会的,这是逐渐发展的过程。在这个过程中,第四产业即智能产业崛起,这是一个赋能的产业,不断地给第一、第二、第三产业赋能,这就是狭义数字经济和广义数字经济的分别,狭义数字经济支持广义数字数据。
第四产业是以数据和AI为基础的新兴产业。未来一切都将数字化,在一定意义上说,未来只有智能产业和广义数字经济,只有两个产业,就是赋能产业和被赋能的物质和服务产业。第四产业的核心是数据,AI也很重要,但数据是基础。
当前全球数字经济发展速度持续高于世界经济的整体增速,在中国,狭义数字经济在经济总量中的占比为6%,美国为6.9%。广义数字经济有不同的统计方式,根据联合国的统计,中国的广义数字经济在经济总量中的占比为30%,美国为21.6%,全球为15%,由此可见中国的数字经济走在世界前列。按照中国信息通信研究院的统计,中国数字经济占国内生产总值(GDP)的比重已达40%左右。中国数字经济的发展也是在持续积极的推进当中,我国数字经济的名义增速高于GDP的增速。与此同时,数字经济在农业、工业、服务业中的比重都在上升,中国数字经济2016—2022年的年均复合增长率为14.2%,增速较快,原因在于中国进入了智能社会。
展望未来,关键在于发挥数字资本在数字经济发展中的乘数效应。数据要素对中国GDP增长的贡献度已达14.7%,此外信息传输、软件服务等产业对数据要素特别敏感,它们能明显提高工业企业的效益。国家工业信息安全发展研究中心所做的中国数据要素市场发展报告显示,数据要素使得工业企业生产效率平均提高42.8%,产品研发周期平均缩短15.33%。由此可见,提高数据的使用效率相当关键,数据资本化的迫切性开始显现。
国际数据资产化与中国战略
数据的重要性与战略性有目共睹,全球不少国家和地区都在不断出台数据政策,政策的宏观层面在于构建整体国家战略,中观层面在于构建标准和市场,微观层面在于明确参与者的能力、具体技术举措和标准。
数据政策的宏观、中观、微观层面
从宏观层面看,美国2013年提出数据开放战略,认为信息是政府合作伙伴和公众的战略资产;2019年美国政府的数据战略明确提出要有数据发展的长期框架,以此培育数据市场,激活数据价值。英国更关注数据的价值生态链,强调数据权益、数据质量和数据治理。英国也制定了国家数据战略,把数据基础设施、数据技能、数据可用性、负责任的数据利用作为激活数据机遇的核心能力。欧盟意识到,数据是未来的资产,欧盟必须在这一方面统一起来。欧盟早在2010年就出台了欧洲数字化议程,明确欧洲必须建立统一的数据市场,此后在2022年提出数据法案,对数据的安全、使用等做出了明确规定,支持欧盟单一数据市场的发展,该法案于2023年实施。
中观层面,主要讲的是数据的价值与功效。美国、欧盟等在推动数据资产跨境交换,完成数据资产定价模式,即一系列的产权定价模式,包括安全性、生命周期等。希望将数据当作资本,数据就必须有估值、有定价,有唯一性、有审计、有核准。中观层面就是建立数据的整体制度。
微观层面,主要是支持企业进入数据市场,在大的框架下开发和运用各种数据。欧洲的数据战略很明确,要发展数据处理技术、能力,提高数据利用效率,加大对人工智能、大数据分析、区块链等基础核心技术的研发投入,减少核心技术的对外依存度。欧盟决定投资40亿~60亿欧元用于开发数据分析、数据基础设施、数据共享工具等。而英国更关注法律、产权的登记、对数据资产管理者进行职业训练、市场的机构参与等行为。
各主要经济体推出的数据政策
各国都在宏观、中观、微观三个维度构建系统,数据的重要性可见一斑。2016年,美国提出在数字经济中实现增长和创新,提出人工智能的振兴计划,欧盟提出安全计划,中国提出网络安全和国家信息发展战略纲要。2020年,美国提出《数字战略2020—2024》,欧盟提出数据战略,中国提出《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》。2022—2023年,美国出台了《国家网络安全战略》《芯片科学法案》《数字资产综合框架》等,欧盟出台《数据法案》《数字十年政策方案》。2023年,中国出台《数字中国建设整体布局规划》《企业数据资源相关会计处理暂行规定》等。2023年非常关键,将之前讨论的战略和政策,以法律法规的形式落实到位,中国在这方面走在了前列。
2022年12月,中共中央、国务院发布了构建数据基础的“二十条意见”,构建了数据产权、流通交易、收益分配、安全治理四项制度。建设数字中国需要两个环境,一是国内的数字治理生态,二是数字领域的国际合作;需要两大能力,一是数字技术创新,二是数字安全屏障;需要五位一体的深度融合,即融合数字经济、数字政务、数字文化、数字社会、数字生态文明,涵盖了我国当今整体经济、社会、科研的方方面面;构建数字中国的两大基础,一是基础设施,二是资源,指的是资本化。
数据资产化推动数据政策落地
当政策框架到位,推动整体战略政策落地实施的是数据资产化,这是市场的力量。数据资产化是一个自下而上的过程,市场也将发挥重要作用,并且会推动政策的落地。据上海数据交易所测算,2022年我国数据交易市场规模已达876亿元,占全球交易规模的13.4%,这是一个很高的比重。
“数据二十条”的主线是坚持促进数据合规高效流通使用,赋能实体经济,充分实现数据要素价值,促进全体人民共享数字经济发展红利。“数据二十条”建立了四项基本制度,这走在了全球其他国家的前面,是一项了不起的举措。
一是数据产权制度。数据的所有权难以界定,原因在于数据具有流动性、安全性、隐蔽性、重叠性,因此,明确建立数据产权机构的分置制度,明确数据的持有权、加工使用权和产品经营权的三权分置,是至关重要的。三权分置始于40多年前我国实施农村家庭承包制的改革制度框架,这是中国的经验、中国的长项。三权分置明确了确权的授权机制,包括公共数据的授权使用、企业数据供给的激励,以及个人数据的受托。这是在世界范围内首次明确了公共数据、企业数据和个人数据的机制,确认了三个所有权的分置,以及三个不同主体的数据使用和运用框架,这是重要的突破和创新。二是数据交易制度。包括监管、准入、流通、标准、定价等,推动开放合作。三是收益分配权。在初次分配阶段,由市场评估贡献、按贡献大小决定报酬机制,“谁投入、谁贡献、谁受益”,由此保护了投资人、生产者,推动数据要素收益向数据价值、使用价值创造者倾斜。除了初次分配外,还存在二次、三次分配,原因在于数据可以不断地被重复使用,有无限的未来。政府需要发挥引导作用,关注公共利益。将收益分配纳入国家战略,这是一个新的重大突破。四是安全治理。
“数据二十条”的政策指向非常明确:一是充分发挥数据要素作用,赋能实体经济。二是做强做优做大数字经济,以应对科技变革和产业变革,构筑中国的国际竞争新优势。三是全民共享数字经济发展红利,由全民共享,统筹分配效率和公平。这属于经济学范畴,数据生产成本高,边际成本为零,收益期限可以无限延伸,因此需要特殊的分配方式。四是提高数据要素的治理效能。
中国的数据入表与数据金融化
2023年8月1日,财政部印发的《企业数据资源相关会计处理暂行规定》,对企业数据资源的确认、计量和披露进行了规范,从财务会计准则入表,赋予数据资源明确的财务属性。2023年8月15日,上海市印发《立足数字经济新赛道推动数据要素产业创新发展行动方案(2023—2025年)》,指出推动数据资产化评估试点交易行为等举措,明确了数据交易制度框架。
“数据二十条”和数据资产入表的意义
传统资产入表主要指的是土地房屋进入固定资产项目,股票期权计入长期股权投资。数十年来又逐渐引入知识产权入表,即无形资产也可以作为资产,这已经是实现了重大突破。但是此次引入数据资产入表,原因在于数据资源可费用化,如果满足资产确认条件,就能计入资产负债表的无形资产或者存货科目,由此数据资源在财务报表内就有了表达。这一点非常关键,因为只有入了财务报表,才能走向资产化。数据入表不是简单地将数据资源纳入资产负债表,这是一个系统性工程,包括强化数据合规意识、数据治理、挖掘数据潜力、追踪数据成本等。上述两份文件出台后,市场就开始跟随制定了一系列评估、估值、交易等措施。我国将逐渐建立数据产权登记制度,有了产权登记制度就可以进行交易,产权资本随之产生。由此可见,“数据二十条”和数据资产入表,推开了数据资本化的大门......
本文根据作者在清华五道口在线大讲堂联合“未来已来——全球领袖论天下”系列讲座中的主题演讲“数据资本大时代”演讲速记稿编辑整理而成。
- 推荐
- 新闻
- 观点
- IT/互联网
- CEO
- CTO
- CIO
- CDO
- 智能制造
- 人工智能
- 战略
- 研发
- 生产制造
- 运营
- IT
推荐
我要评论