摘要
本文采用“整体分解”的方法。首先,将数据价值链分为数据记录与获取、数据采集、验证与存储、数据分析和数据元配置四个部分,依次论述了区块链在这些环节中的作用。
关键词:区块链、数据元市场
区块链和数据元市场是目前备受关注的两个领域。今年4月,**中央、国务院在《关于构建更加完善市场化要素配置体系和机制的意见》中,**将数据作为要素之一。在“新基础设施”的定义中,国家发改委将区块链定位在新技术基础设施中。许多专业学者对区块链在数据元市场的应用进行了探讨,并高度肯定了区块链在保护和使用个人数据、完善人工智能开发数据库方面的重要性。但是,与区块链在央行数字货币、稳定币、供应链金融、存单、防伪溯源等领域的应用不同,数据元市场本身处于发展的早期阶段,很多核心问题还没有最终结论,这就引起了讨论关于区块链在数据元市场的应用难以深化。
本文在前人研究的基础上,探讨了区块链在数据价值链不同环节中的作用。根据全球移动通信系统协会(Global Association for mobile communication systems)2018年的报告[1],数据价值链可分为四个部分(图1):一是数据生成,即数据记录和获取。二是数据采集、验证和存储。数据分析是指对数据进行处理和分析,以产生新的见解和知识。第四,交换是指数据分析结果的使用,可用于内部使用或外部传输。这个环节更适合称为“数据元分配”本文共分为五个部分,前四部分根据以上四个环节依次展开,重点是第四个环节,第五部分对全文进行总结。
图1:数据价值的关键环节
一
区块链在数据记录与获取中的应用
区块链是关于代币的分布式账本,本质上是区块链中定义的一个状态变量(代币在支付领域的另一个含义将在第4部分讨论)。在区块链中,既有与代币及其交易相关的数据,也有与代币及其交易无关的数据。
与代币及其交易相关的数据——区块链的每个地址有多少个代币,不同地址之间的代币交易记录——最初都是在区块链中生成,并由区块链记录,这是数学规则的产物,真正的准确性是由密码学来保证的,共识算法等,从区块链存储空间占比和验证节点(矿工)投入的计算资源来看,这部分数据在区块链内的数据中占据主导地位,也是区块链中“价值内容”**的数据。例如,在央行数字货币和稳定币的应用中,这部分数据是分析资金流动、实施反洗钱和反恐怖融资监管的基础。例如,在加密货币定价中,链内交易数据是重要的估值参考。
与代币及其交易无关的数据作为代币交易的附件写入区块链。写入区块链意味着整个网络是可见的,不能被篡改,**和传播也不会出错。然而,区块链本身并不能保证这些数据在源头和写作环节的真实性和准确性。由于区块链存储容量的限制,大部分数据只能以哈希摘要的形式写入区块链,只有少量的结构化信息以原始数据的形式上传到链中。因此,在现实世界中无时无刻不在产生的海量数据中,可以链接到链上的原始数据所占的比例几乎可以忽略不计。这说明区块链不是通用的账簿或数据库,而是应该使用的。只有价值足够高的数据才值得以原始数据的形式链接起来。
哈希摘要上行链路的主要功能是存储证书[2],以增加存储在本地设备或云上的原始数据的信用。事后,通过揭露原始数据(如允许外部机构渗透到存储原始数据的本地设备),证明两点:一是原始数据确实存在于区块链记录的上传时间点;二是上传者确实知道原始数据。然而,理解区块链在证书存储和数据信用增强中的作用并不合适。特别是对于原本不是在区块链中生成的数据,其可信性离不开专门的数据记录采集技术和相关系统的支持,如下面将讨论的物联网的“区块链+物联网”数据管理。
物联网设备不断从周边地区获取地理位置、温湿度、速度和高度等数据。在目前的端到端抗攻击技术下,在一定程度上保证了物联网数据在源头的真实准确性。物联网数据主要存储在云端和本地物联网设备上。大多数物联网可以运行哈希算法和公钥签名操作。在物联网数据链中,只有少量的结构化数据可以直接写入区块链,而且大部分数据都是以哈希摘要的形式出现的。因此,在物联网的“区块链+物联网”数据管理中,相关操作由物联网设备自动执行,效率高,减少人为干预。
“区块链+物联网”为理解区块链在数据记录和获取中的应用提供了一个基准。除了物联网数据外,很多数据在记录和获取过程中都受到人为因素的极大影响。是否值得连锁,我们需要计算成本效益明细账。
一
区块链在数据采集、验证和存储中的应用
数据采集、验证和存储主要依靠数据库技术,区块链的直接作用有限。比如现在金融领域的个人数据管理,一般都强调API技术的应用,通过数据聚合产生复合价值。
正如第一部分所讨论的,区块链可以存储的数据非常有限。但大部分数据可以通过本地哈希链或哈希链存储在本地设备上。另外,如果通过不同机构组成的市场分割网络进行数据采集、验证和存储,那么理论上可以在区块链上建立市场分割网络。分布式存储项目filecoin可以看作是这个方向的一次尝试[3]。为了在这个方向上取得广泛的成功,我们需要做好分布式经济的机制设计。我将相关的经济问题概括为去中心化数据经济,这将在第4部分中讨论。
一
区块链在数据分析中的应用
区块链在数据分析中的直接作用也非常有限。由于区块链内计算性能的限制,复杂的数据分析工作一般不通过区块链内的智能合约进行,而主要依靠统计学、计量经济学、数据可视化、大数据分析和人工智能等技术,相关计算发生在区块链之外。
如果数据分析也是通过由不同机构组成的市场分割网络进行的(如有的机构提供算力,有的机构提供算法),那么理论上也可以引入基于区块链的分布式数据经济。例如,平台项目致力于建设高性能计算网络,以促进数据流和算力。主要市场参与者包括计算协调员、数据提供商和算力提供商[4]。
一
区块链在数据元配置中的应用
区块链作为一种具有生产关系色彩的集成技术,在数据元市场的应用将主要体现在数据元配置上。接下来,我们将从数据元权利确认和数据元市场组织两个层面来探讨这一问题。
(1) 数据元确认
经济研究表明,任何有效配置资源的前提都是确定资源的产权,数据元素也不例外。产权是一个复杂的经济概念,它是指一种可执行的社会结构,它决定着资源的使用或拥有。财产权有三个核心维度:一是资源使用权;二是资源收益权;三是向他人转让资源、改变资源、放弃资源、破坏资源的权利。产权可以细分为所有权、占有权、控制权、使用权、收益权和处分权等“权利束”
数据具有商品和服务的特性。很多数据都是非排他性和非竞争性的。数据的所有权在法律和实践中都是一个复杂的问题,尤其是对于个人数据。在现实中,能够明确界定所有权的数据的典代表是专利,但从专利可以看出数据权利确认的复杂性。
获得专利权的前提是公开发明的技术内容,让公众进一步改进,避免重复研发资源的浪费。例如,专利审理机关将在申请发明专利后大约18个月披露专利说明书的内容。专利权人在法定期限内享有专利技术专有权,享有商业特权。这是为了保护发明人的权利,鼓励公众从事发明创造。专利权法定期限届满,专利权消灭,公众可以根据专利说明书记载的内容自由使用专利技术。
从全球实践来看,数据元权利的确认是法律与技术共同作用的产物。一般而言,数据产权的制度框架是由法律决定的,而这些制度框架的可执行性则由技术来保证。例如,许多报纸和杂志现在都是付费的。只有付费账户才能阅读文章,而科技被用来限制文章的**和截屏。如果有人剽窃,他们将通过法律保护自己的权益。在许多情况下,仅仅通过技术手段来确认数据元的权利是不可能的。第一部分讨论区块链在证书存储中的作用。数据存储不等于数据确认。例如,发明人可以将发明文件的哈希摘要放在区块链上,以证明自己先做出了相关发明,并且在将来发生纠纷时具有“自我认证”功能。但是,如果未经专利审查机关核准,链上的发明文件并不意味着专利权。
一些专家学者认为,只有所有权明确的数据才能进入数据元市场。这是一个很大的误解。”“明确所有权+收购”模式只适用于专利等特殊类的数据(例如,许多并购交易都包括专利的定价),但不会成为数据元市场的主流。在实践中,建立数据元市场的前提是对数据的有效控制,即控制谁可以在什么条件下以何种方式使用数据。也就是说,数据产权归根到底体现在对数据的有效控制上。这一视角有助于理解区块链在数据元权利确认中的作用。
在区块链中,地址可以隐藏实际控制人的身份,哈希摘要可以隐藏原始数据,但区块链本身并不是隐私管理技术。特别是公链中的数据在整个网络中都是可见的,因此需要配合环签名、混合货币和组合货币技术来隐藏链中的资金流动。联盟链可以实现数据的差异开放,使得不同的用户对区块链中的数据有不同的读取权限。然而,正如第一部分所讨论的,区块链中存储的数据毕竟是有限的,区块链在数据控制中的直接作用也是有限的。例如,“区块链+政府数据共享”项目中,政府数据存储在本地设备上(一般是政府部门的内部安全网络),跨政府部门的数据传输仍采用传统方式进行,原始数据无法在区块链上流通。但是,区块链会记录数据的申请、授权、呼叫和访问记录,从而实现事后审计的不可否认性。
在各种数据控制技术中,最重要的是密码学,包括可验证计算、同态加密和安全多方计算。对于复杂的计算任务,可验证的计算生成一个简短的证明。只要验证了短证明,就可以判断计算任务是否准确执行,而不必重复执行计算任务。在同态加密和安全多方计算的情况下,对外提供数据时采用密文代替明文。这些加密技术使得“可用数据不可见”,但由于对计算资源的高需求,只能在区块链之外进行。
在各种数据控制技术中,最容易与区块链混淆的是支付代币化,本文对此也作了简要说明。支付代币化是代币[5],它是指使用特定的支付代币(英文支付)代替非银行支付机构的银行**、支付账户等支付要素,并限制该标志的应用范围,降低商户、受理机构方面银行账户、支付账户信息泄露风险,减少交易欺诈,保障用户交易安全。支付标志、银行账户、支付账户之间存在映射关系。映射关系由标记服务提供商通过支付标记化和标定两个过程进行管理。支付代币化是数字支付的核心内容。例如,在移动支付中,用户使用代币号码作为存储在移动设备(如移动电话)中的设备**。他们可以在POS、ATM等终端上离线使用移动设备进行非接触式近场支付,也可以直接在移动客户端发起远程支付。
目前,银联手机闪付和在线支付产品已全面应用支付标签技术。从以上介绍可以看出,支付代币化中的代币代表银行账户、支付账户等敏感信息,具有标准化的编译标准,不依赖复杂的密码技术;区块链中的代币代表着在数字货币、央行稳定币等应用中的法定货币储备资产,但代币本身是区块链技术的产物。
(2) 数据元市场的组织形式
由于数据元类和特征的多样性,缺乏客观的估值标准,在很多情况下不会采用买断交易模式,因此数据元市场不会像股票市场那样成为一个中心化、流动性强的交易市场。这一点可以从过去几年多个省市在大数据交易中心或大数据交易所进行的实验中得到验证。这些实验都没有取得预期的成功。究其原因,固然有政策支持不足、配套技术不足等原因,但更重要的原因是数据元的经济属性不支持高度规范化、竞争撮合、交易活跃的交易模式。
从大局看,数据元市场将更接近债券市场、场外衍生品市场等场外市场,标准化程度较低。点对点交易和协商定价会导致交易频率较低,但这种情况会一直发生。但这并不意味着最终数据提供者(如个人和物联网设备)和最终数据需求者(如AI算法公司)将直接进入交易。数据元市场将演化出一些“数据中介体”,使数据从最终的提供者流向最终的需求者。
因此,数据元市场将分布在整体架构中,但会有一些“数据中介体”作为核心节点。区块链在数据元市场组织形式中的应用应该在这个大框架下进行分析。
首先,数据中介的主要功能是数据收集、验证、存储和分析。第二和第三部分分析了这些“数据中介”如何使用区块链。需要补充的是,区块链可以用来改进数据发布。例如,姚谦在2018年提出将区块链应用于央行数字货币原系统[6]。他的想法是,央行和商业银行将建立央行数字货币分布式账本,通过互联网提供外部权限确认和查询的网站,实现央行数字货币的在线现金检测功能。利用区块链的不可伪造性和不可伪造性,提高权限确认查询的数据和系统安全性。
其次,如前所述,现实世界中的大部分数据不会通过区块链进行存储和传输,但区块链可以记录数据的授权、调用和访问,这类似于区块链在供应链管理和商品追溯场景中的应用。这个应用方向很有价值,但创新的意义不是很强。首先,数据分析和使用会产生新的数据,这使得数据流的可追溯性意义不大。其次,如果我们想从数据保密和防泄漏的角度来跟踪和跟踪数据流,分析TCP/IP数据包是比区块链更直接、更有效的方法。
第三,区块链作为数据元市场的组织工具,是较早引入的分布式数据经济概念
分布式数据经济的基础是数据权利的确认,这体现在数据提供者能够有效地控制数据需求者对数据的使用。
分布式数据经济是一个丰富的数据生态。不同的参与者在数据、算法(数据分析方法)和算力上相互交流。其实质是通过市场机制开展大规模协同计算,在数据产权保护下实现数据元的有效配置,从而促进经济发展和社会福利。
区块链记录分布式数据经济中的经济活动,但不是为了证明和可追溯性,而是为了核算经济活动。
在分布式数据经济中,以中央银行数字货币或稳定币作为交易媒介。原因是分布式数据经济中的一些参与者可以是非个人的,比如物联网设备作为数据提供者,人工智能算法作为数据需求者。中央银行数字货币和稳定币可以兼容分布式数据经济的开放性,保证支付的安全性和效率。
对于分布式数据经济,有许多有趣的场景。例如在“区块链+物联网”中,物联网的设备ID与数字货币的钱包地址绑定在一起,使得物联网中的数据存储、传输、挖矿和价值互动能够可靠地进行,物联网中与数据相关的经济活动也能得以进行通过中央银行的数字货币或稳定币计算。可以想象,当一个物联网设备持续提供高质量的数据时,它会收获更多的央行数字货币或稳定币作为“奖励”(实际上属于物联网设备所有者)。这种经济激励措施将显著促进物联网数据的收集和使用。
这一方向有助于实现肖峰博士提出的分布式认知工业互联网[7]。分布式认知工业互联网采用分布式治理结构,所有企业都可以轻松加入。它采用基于知识地图的认知智能技术和基于隐私计算的数据协作技术,基于生命周期管理的制造与服务一体化。
一
摘要
区块链对于构建数据元市场具有重要意义。但是,由于数据元市场本身处于发展的早期阶段,很多核心问题还没有定论,这使得区块链在数据元市场应用的讨论难以深入。本文采用“整体分解”的方法,探讨区块链在数据价值链不同环节中的作用。
第一,数据记录和采集。区块链作为代币的分布式账本,不能作为通用数据库使用。代币及其交易相关的数据来源于区块链并由区块链记录,是区块链中“价值内容”**的数据。然而,在现实世界中海量数据中,原始数据在链上所占的比例几乎可以忽略不计,大部分数据只能以哈希摘要的形式写入到区块链中。哈希摘要上链具有存储证书和增加原始数据信任的功能。”“物联网+物联网的应用,为物联网+物联网的数据采集和记录提供了一个更高的效率”无论其他数据是否值得这个链条,我们应该谨慎地平衡成本和收益。
第二,数据收集、验证、存储和分析。区块链在这些环节中的直接作用是有限的。但如果这些环节是通过由不同机构组成的市场分割网络来实现的,那么它们就可以建立在区块链上,成为分布式数据经济。
三是数据权确认。数据元素的确认是数据元素的基础。数据元的权利确认是法律与技术共同作用的结果。区块链的数据存储并不意味着数据权利的确认。在实践中,数据确认主要体现在数据提供者能够有效地控制数据需求者对数据的使用。从这个意义上讲,区块链(尤其是公链)不是一种隐私管理技术。联盟链可以对不同的数据开放,这样不同的用户对区块链中的数据有不同的读取权限。但是,区块链中存储的数据是有限的,区块链在数据控制中的直接作用也受到限制。可验证计算、同态加密和安全多方计算等加密技术使“数据不可见”但是,由于计算资源需求量大,只能在区块链之外进行。
四是数据元素的配置。数据元市场将在整体架构中分布,但会有一些“数据中介”作为核心节点。区块链的不可伪造性和不可伪造性有助于改善数据发布环节。区块链可以记录数据的授权、调用和访问,具有一定的价值,但创新意义有限。区块链在这一环节的创新价值主要体现在分布式数据经济上。从本质上讲,它通过市场机制进行大规模协同计算,在数据产权保护下实现数据元的有效配置。分布式数据经济有助于实现分布式认知工业互联网。本文是万象区块链首席经济学家邹传伟博士撰写的关于万象区块链“整合与创新”的一系列行业研究文章。
文章标题:区块链在数据元市场中的应用
文章链接:https://www.btchangqing.cn/102433.html
更新时间:2020年09月17日
本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。