朱民:智能时代「数据资产化」迎来变革关键期

朱民:智能时代「数据资产化」迎来变革关键期
伴随大数据、人工智能等技术的发展,人类正逐步由「信息时代」走进「智能时代」。在这个过程中,「数据」逐渐成为商业经济的核心。清华大学国家金融研究院院长朱民在“2021北京智源大会”的报告中认为,在这种趋势下,如先前一样,仅把数据视作「资源」,已经不足以适应时代的需求;为了推动数据流动,促进智能社会发生,应当将数据视作「资产」,明晰其所有权、使用权、经营权和分配权等。作为「资产」的数据,相较于实体资产,有诸多不同特点,这必然给经济学家和政府带来一些列挑战,例如如何确保数据的隐私安全?如何分离所有权、使用权、经营权、分配权?如何对数据进行估值?……朱民院长提到,随着疫情的爆发,中国经济在经历根本的转型,正逐渐从资源驱动经济转向数据驱动经济。这种转变意味着,从历史意义上,作为数据大国的中国,将面临着经济发展轨迹的转变,全面推动数据资产化,将有助于中国经济走向高收入发展阶段。朱民院长在报告中强调,“我们要理解和相信这一点:数字资产化将是下一个颠覆世界和推动时代发展的里程碑。”智源社区对朱民院长的报告作了不改变原意的编辑和整理,本文未经讲者确认,仅供读者参考。朱民:大家上午好!我今天给大家汇报的议题是《数据资产的时代》。在今天,数据正逐渐从「资源」走向「资产」,这其中涉及到科学、经济学,同时也涉及到整个市场。因此我想和大家汇报一下我观察到的“数据资产的时代”是怎么到来的,它面临的一系列挑战,以及我们该怎么往前走。「信息时代」走向「智能时代」:数据成为第一出发点我们正在离开「信息时代」走向「智能时代」,这是一个很重要的概念。在信息时代,信息可以在任何地点、任何时间几乎零成本地获取,我们在过去十年经历了这一切。但尽管信息无处不在,做出决策的依然是人,数据让我们应接不暇。这个时候工程师做的软件、程序、工具、算法变得非常重要。这是应用先行的时代,数据只是数字化服务的副产品。但现在,信息时代正在走向智能时代。理解这点非常重要。由于现在数据产生的规模是如此之大,速度是如此之快,计算机使用数据的规模和频率在不断地增长。同时,数据也让机器能够更加智能化。我们应该注意到,现在整个的应用,是以数据为起点,使得系统智能化,从而能处理更多的数据。所以在智能时代,是数据先行,数据是根本的第一出发点。我们传统的人类智能是从观察走向科学,从科学走向技术,最后走向产品。但是在智能时代,是数据直接通过人工智能技术走向知识,知识走向产品,整个生产过程短了很多,效率高了很多。与此同时,在产品运行的过程中产生更多的数据以及数据的迭代来优化起点的数据,完成正循环。我们从观察试验、归纳总结的个体科研行为或小群体科研行为,开始走向一个全社会的、广泛的、无限制的数据和智能行为。这是人类有史以来,第一次找到了第二个知识获取的平行途径,也即机器认知。从上面的分析,我们知道机器认知和人类认知的途径不完全重合,是平行发展的,从而扩大了知识的绝对空间,在观察和归纳走不到的地方,机器可以自己发现无数以前因为认知原因看不到的东西。这个在最近十年的科技(特别是在空间、宇宙方面)得到了很好的证明。当数据变成了基础之后,数据和知识成为了一体两面,数据是知识的载体,数据流通就是知识流通。这是一个很大的变化。当这个概念发生变化的时候,我们看到数据的规模也在迅速的扩大。IDC(2018)预测到2025年,全球数据将达到175ZB,而其中可能有90ZB是来自物联网(注意,不是来自人,而是物联网),80%的数据将是非结构化的。如果从中美比较的话,我们可以看到 2018年中国的数据总规模还是2.76ZB,比美国少得多;但到2025年,预计中国的数据总规模将达到48.60ZB,远超美国的30ZB,大概是美国的1.5倍。中国现在毫无疑问是数据大国,明天将是更大的数据大国。数据是一切的起点,中国又是数据大国,在这样的场景下,让数据运作起来就变得特别重要。我们来看全球数据流动带来的经济效益。麦肯锡做过一个分析表明,2005年~2014年期间,跨境数据流动为全球GPD带来了约3%的增长,数据流所产生的附加值估计为2.3万亿。最新的数据表明,欧盟有近 8% 的GDP是从个人数据中产生的。由于数据跨境流动,同时也促使了贸易流动、外国直接投资和人员流动等,所以如果同时考虑数据流的直接和间接影响,其实已经超过了货物贸易对GDP的贡献。因此数据不仅是科学原创力的起点,同时它也产生了财富。数据作为「资产」:特点与挑战当我们看清数据的意义之后,如何管理数据,给我们带来一系列的挑战。我们先来看数据的特征。我归结有如下几点:技术维度:质量参差不齐,收集目的不同,目的不同,非标准化,非结构化,此外也是相互隔离的;独特的经济学特征:虚拟,可重复使用;高昂的固定成本,但却有非常低廉的复制成本;非竞争性,非排他性,也即是可共享。这一点从经济学意义上给我们开拓了一个很大的想象空间;外部依赖性:数据具有时效性,应用场景、应用算法以及网络效应都会决定数据结构、数据存量和数据价值;生成性:数据本身是无价值的,其价值只体现在使用它的时候。这一点在考虑如何将数据资产化时是一个重要的要素;数据的非经济学维度;数据的社会治理:隐私、合规、机密、安全等。在最初人们的理解里,数据是一种资源。上世纪70年代伴随着计算机科学的快速发展,信息被视为与人力资源、物质资源、财务资源和自然资源同等重要的资源,由此衍生出了“信息资源”的概念。而在上世纪90年代,伴随着政府和企业的数字化转型,衍生出了“数字资源”的概念,这是有含义的数据集结到一定规模后形成的资源。但在过去几年里,由于大数据的兴起,数字经济出现了突飞猛进的发展,这让我们意识到,数据不但是一种资源,更是一种资产。人工智能技术的兴起,让我们越加明确了这一点:只有把数据从资源变成资产,我们整个的智能社会才能得以运转。因为智能社会的出发点是数据,数据如果不是资产,就无法承担重大的社会责任和经济功能。“数据资产”这个概念其实也是不断形成的。最早是由理查德·彼得斯于1974年提出的,但他主要认为数据资产包括持有的政府债券、公司债券和实物债券等资产。2011年,世界经济论坛的一个报告中,指出个人数据正成为一种新的经济“资产类别”。现在大家已经普遍认识到“数据资产”的重要性。数据资产有一系列的特征,如下表所示:大数据和人工智能等技术要求数据要有足够的规模、足够的维度、足够的密度,要支撑这3个基本概念,数据也必须资产化。然而在“数据资产化”的过程中,我们面临着许多挑战,简单来说,有几点:数据产权是模糊的。目前行业的潜规则是“谁采集,谁拥有”,但消费者在网上购物,支付是银行,“网上”是平台,“购物”是商家,数据在这么多地方流通,谁才是数据的最后拥有者?这是很值得讨论的法律问题,目前由于缺乏法律的约束,交易风险和个人数据合规仍然面临巨大挑战。隐私与安全问题突出。从社会、企业、管理、技术等各个层面,都缺乏对数据隐私和安全的保护。数据定价与估值困难。由于数据价值具有变动性、不确定性、无限性和权属复杂性,使得如何给数据定价、估值变得极为困难。数据开放与流通困难。数据不流通就是孤岛,孤岛不能达到数据的集聚和密度,效率就大打折扣。以上这是我们看到“数据资产化”面临的最根本的挑战。怎么应对这些挑战呢?第一,针对技术方面的隐私安全挑战,目前已经出现了多方安全计算(MPC)、同态加密、联邦学习、安全沙箱计算等方法。第二,针对交易中出现的数据所有权、使用权、经营权和分配权分离等挑战,中国是有经验的,土地承包就是处理土地方面的这些权益。在今天的法律下,数字所有权是模糊的。因为数据的非经济学特征,决定了所有权不能交易。但因为它可复用,所有权也没有必要交易。从这个意义上,我们现在正在逐步探讨,把所有权、使用权、经营权和分配权隔离,能够在分离意义上抽出使用权、经营权、分配权的归属,建立一个生态,这个事情就往前挪了一大步。第三,是数据资产金融化时面临的估值挑战。首先,数据在产生之后,需要进行清洗、拆分,这个成本很高。其次,数据价格的内在定义与先前的物品的定义很不一样,因为数据的价值是长期的,它可以被反复使用,只有不断扩大、密集,其价值才会不断增大,这是一个动态发展的过程。所以数据资产的估值,起点是高成本,终点是长期回报,这需要在经济和金融上进行探讨,我们用“成本法”会比较难,大概要用“收益法”,用不断的增收,包括全金节约、超额收益、增量收益等,所有者、经营者、持有者、分配者都在其中得到了公平的、分享的钱。这类似于合作的股权公司,所有人共享数据的未来收益。第四,数据资产商业模式的挑战。数据资产的商业模式,应该是“数据平台交易模式”,还是“数据银行模式”,亦或“数据信托模式”?数据平台交易模式。当下的模式比较多的是数据平台交易模式,即一个平台,把各种数据汇拢,经过对数据的计算,从而得到应用,达到商业价值。数据银行模式。另一方面,数据资产与货币资产本质上又有很多共通点。那么能否有一个类似银行一样的机构,我们称为“数据银行”,把数据存进去,逐渐产生收益。银行可以把收集到数据加工生产,变成产品服务大家。这种方式,无论在规模上,还是在性质上,都与银行类似。数据信托模式。这是最新的概念。在这个概念里,数据的所有权不变,只是放在信托的池子里,我们称之为“数据公社”,我们都是数据的所有者,许多数据所有者加入到数据公社,这是一个信托关系,商业的运营者是代理人,通过技术把数据整理干净,产生收益,最终收益回馈信托者(也即数据所有者)。这几种模式,我们看到比较多的是平台交易模式,但理念最先进的是信托模式,因为后者可以更好地把所有权、使用权、经营权和分配权分开,虽然其商业模式还有很多地方需要探讨,但从整个宏观的高度/市场的角度,它最终会形成数据资产“三位一体”的架构生态,包括数据资产本身的生态、数据可信计算的生态和数据安全共享的生态。从这个意义上,数据从资源走向资产,需要构建安全、可交易、有效率的数据资产生态,这个生态必须有科技(计算方案)、市场(激励机制)、政府(监管和法律框架)和国际(全球治理机制)等。全球数据监管框架:国内鼓励,国际约束现在全球关于全球的数据治理问题讨论已经很多,我们可以看下这些讨论,这对构建我们中国的数据资产生态也有启迪。目前全球的数据监管框架依然是:鼓励国内,约束跨境。国内鼓励共同数据共享与开放,例如企业-政府数据(B2G)共享、企业-消费者数据(B2C)共享等。欧盟在2020年的《数据治理法案》中就创造性地引入了“数据利他主义”,希望数据可以多次公开使用;而中国在2020年《数据安全法(草案)》中规定了“政务数据安全与开放”,构建统一规范、互联互通、安全可控的政务数据开放平台,推动政务数据开放利用。然而在国际上,现在的担忧还比较大,国际数据跨境流动受到很大的限制。国际数据出于安全的顾虑,以及国家间的法律差别很大,目前数据在国际间的跨境流动还不是那么容易。例如美国强调跨境数据流通的价值,而欧洲则更侧重保护个人权利。不过现在有了几个基本原则。以APEC跨境隐私规则体系(CBPR)为例,它要求九项个人数据保护基本原则,包括防止损害原则、通知原则、收集限制原则、个人信息使用原则、选择原则、保持个人信息完整原则、安全保护原则、访问和更正原则,以及责任原则。这个基本框架,很有借鉴意义,对整个生态的构建提出了好的模式。但国际的生态模式也不一样,欧洲的模式是数据安全优先(GDPR),美国的模式是商业利益优先(CBPR),日本基本上是把欧洲模式和美国模式放在一起(GDPR+CBPR)。此外,我们看到数据流动监管框架和国际合作,在贸易的框架下逐渐在丰富。这表现在:1、在多边、双边贸易谈判中,引入了数据跨境自由流动条款。例如WTO贸易规则框架下的数字贸易议题,包括了跨境数据流动、数据贸易规划、数字信息技术能力保障、数字基础设施等;2、弹性化的多边隐私与数据保护监管合作模式。APEC隐私保护是亚太地区第一个数据保护协同框架,构建了一整套的执行机制和措施;3、通过国际组织为成员国达成数据保护的共识提供指导。这类隐私和数据保护框架不具有强制的约束力,不过在成员国制定国内的数据保护法的过程中依然能够提供原则指导。当前全球数据流动监管政策呈现出新的趋势:趋势一,跨境数据流动与数字服务贸易,呈现“有限性特征”、“本地化”一直存在;趋势二,对涉及国家安全利益的数据采取“灵活化”的对策,例如分级、分类监管,同时也在不断放松;趋势三,围绕数据主权和长臂管辖权博弈,目前呈现出“加剧化态势”。中国经济转型:资源驱动到数据驱动之所以谈国际,也是希望能够从国际上的这些概念来看国内。中国目前正在全面走向数字经济,数据变得越来越重要了。中国经济的驱动力,在疫情之前主要是资源驱动,例如土地、石油、电力、建筑业、机械设备、交通运输等;但在疫情后,变成了数据驱动,包括以算法、算力、数据为主的数字经济和以云基建、端基建、管基建为主的新基建。中国经济在经历根本的转型,正逐渐从资源驱动经济转向数据驱动经济。在这个过程中,同时我们也可以看到共享经济正走向无接触经济;整个全球价值链,正走向自主创新模式,在核心科技赶超、前沿科技创新等方面进行发力。在所有这些方面,数据是基础,也是第一推动力。我们看互联网人均流量的变化。2019年,中国的人均流量是9GB/月,OECD国家是6GB/月;十年以后,2030年,中国人均流量将达到100GB/月,而OEDC国家只有50GB/月。物联网是智能时代很重要的一个方面。物联网方面,我国在2019年是10亿美元,到10年之后,我们会翻十倍,达到100亿的规模,而OEDC国家只有50亿,我们将是他们的两倍。毫无疑问,中国将是世界上的数据大国。数据产生,会越来越多,但怎么用这些数据呢?从跨境数据来看,很有意思,今天跨境数据主要还是非娱乐图像和娱乐类。但我们看2015年和2025年的对比,会发现以后生产力类和IoT类的数据会变得越来越重要,也即物联网的数据会变得越来越多,毕竟人产生的数据有限,机器产生的数据则是无限的。我们正在打造的5G和云基础的物联网,这是中国的战略目标,从2015年开始,步步推进。2020年,我们改良过的IPv6节点数已经超过美国,做到了世界第一。中国产生的数据越来越多,数据资产化也就变成特别核心的一个点。在这个过程里,政府起着特别重要的作用。个人端,由于其主体过于分散、权属过于复杂、数据价值参差不齐、应用难以溯源、个人意识薄弱等,会导致价值真空。企业端,由于存在超大型企业数据马太效应、商业化驱动的信息茧房、数据记录与边界、数据应用与利润分配等,在面向个人数据时,往往会陷入两难境况。政府就需要同时面向B端和C端进行抉择,来支持数据从资源走向资产,打通这个通道,让数据动起来。所以,中国要走在世界的前沿,就必须要抓紧构建生态。这个生态的第一步,就是发展计算技术的内生安全性和向善性。我们现在已有的隐私计算,科学家认为很好,但关键还是怎么能够内生安全与向善,为整个人类向善的方向服务。其次是定义所有权,以及去分离所有权、使用权、经营权和分配权等。再次,是平衡保护隐私和共享使用之间悖论,确保数据不动,但数据价值能够流动。此外还有市场激励机制、分配函数、法律框架、监管框架、政府的作用和地位等。最后,中国是数据大国,我们要参与到全球数据资产治理、法律、流动、交易当中。中国正在走向数字经济时代,数据资产化是特别重要的一步。这也是当前整个宏观经济任务里特别重要的一个挑战,也是具有重大历史意义的一件大事,我们都需要动起来。数据资产化,将是大变革!我简单总结一下我的报告。世界正在离开信息时代,进入智能时代。数据、算力和算法都在加速这一过程,整个物理世界和经济、社会生活都正在被数字化。我们要理解和相信这一点:在此意义下,数据资产化将是下一个颠覆世界和推动时代发展的里程碑。中国目前已经是数据大国,因此推动数据资产化,对中国科技创新、经济增长和社会发展,意义重大。因为我们正在进入智能时代,这是所有历史的新起点,所以我们需要迎接这个挑战,继续改革开放,全面推动数据资产化,助力中国经济走向高收入发展阶段,从而改变中国经济发展的历史轨迹。这是一个特别重要的任务和转折点。这就是今天想给大家汇报的我的观察:数据资产的时代。谢谢大家!