介绍
近年来,学术界和产业界对区块链的理解和应用存在很多误解。在过去的文章中,我也逐渐对其进行了澄清和重新定义。但是,我总觉得意义不够,没有专门的话题来组成篇章。最近,随着一个分布式产业协作模式的设计,每次区块链技术的应用精细化,我觉得需要一系列的文章来逐一解释这些误解。希望通过我的反复倡导,为区块链产业的应用提供更多的解决方案和定义。
这一次,我们将首先讨论“区块链是一个共享数据库”的说法是否有问题。百度百科这样描述区块链:“区块链是信息技术领域的一个术语。从本质上讲,它是一种存储在其中的数据或信息,具有“不可伪造性”、“全程跟踪性”、“可追溯性”、“公开透明性”和“集体维护”的特点,可以说大部分人认为区块链是一种共享数据库,这一点受到百度百科的影响很大。首先,我们讨论数据库是否共享。百度百科这样描述区块链:“区块链是信息技术领域的一个术语。从本质上讲,它是一种存储在其中的数据或信息,具有“不可伪造性”、“全程跟踪性”、“可追溯性”、“公开透明性”和“集体维护”的特点,可以说大部分人认为区块链是一种共享数据库,这一点受到百度百科的影响很大。
接下来,让我们分析一下共享数据库是什么?
1、 什么是共享数据库
我通过“知网”搜索“共享数据库”的关键词,没有找到直接匹配的论文,而是更多关于数据共享模式的论文;通过百度百科搜索,没有找到“共享数据库”的概念描述,但有“共享存储”(概念完全不同,如果您感兴趣,您可以自己搜索)。可以说,“共享数据库”并非一直以来学术界和系统软件实践的概念,“共享数据库”更多的是网络造词的畸形产物之一。
这是因为,无论从数据集成与共享模式分析,还是从数据库分类分析,“共享数据库”都是一个伪命题。
首先,从数据库的定义来看,“数据库是按照数据结构组织、存储和管理数据的仓库。它是将大量数据长期存储在计算机中,组织、共享、统一管理的集合”[1]。也就是说,数据共享本身就是数据库的基本功能之一,不需要借助区块链技术来构建数据库的数据共享能力。
其次,从数据库分类的角度来看,目前常用的分类按照数据结构的组织方式可以分为“关系数据库”和“NoSQL数据库”;根据部署模式,可以分为“单一数据库”和“分布式数据库”,没有根据数据库的共享程度进行分类。
而且,从数据共享的角度来看,行业中经常采用数据集成的方式,实现不同来源、不同格式、不同特性的数据在逻辑上或物理上的有机中心化,为企业提供全面的数据共享。数据集成系统一般采用联合体、中间件模和数据仓库等方法来构建数据集成系统,可以使用许多成熟的框架。
因此,在数据库技术和企业数据共享模式的发展中,从来没有出现过“共享数据库”的概念,因为开发数据库软件的初衷是解决数据的组织、存储、管理和共享问题。
2、 为什么你认为区块链是一个共享数据库
上面提到“区块链是一种共享数据库吗?”是一个伪命题,因为数据库的任务之一是提高数据访问和共享的便利性。那么为什么我们有这样的定义呢?我想“区块链是一种共享数据库”主要是受一些常见的底层区块链平台或产品的影响。
首先,大部分公链平台,如bitccoin、以太坊、EOS等,本身并不是一个通用的底层区块链平台。它们都是基于点对点的资产交易来构建区块链相关技术的组合,包括加密技术、分布式技术、P2P数据传输、共识算法、链数据结构、博弈论等,技术的应用就是服务于点对点、安全、高效的资产交易。因此,在非资产加工行业,如政务、产业、供应链等,直接使用基于公链的区块链技术往往是不兼容的。既然公链平台的商业目的很明确,我们就不讨论比特币是否是共享数据库。
其次,在大多数已开发联盟链应用的行业中,底层应用较多的是Apache hyperledger系列平台,这一点深受hyperledger的影响。以hyperledger的核心织物为例。Fabric是一个通用区块链平台,业务目的不明确。从下图可以看出,fabric节点主要由智能合约(早期链码)和分布式账本组成。节点中的数据主要由分布式账本存储。
结构节点组成来源:hyperledger Fabric technology白皮书[2]
分布式账本主要由区块链和全局状态组成。全局状态的更新由块中的事务处理触发和确定。如下图所示:
面料书籍构成来源:hyperledger Fabric技术白皮书[2]
从下图可以看出,分布式账本中的世界状态本质上是一个分布式千伏存储模。结合分布式节点网络,不难解释为什么区块链被视为共享数据库。
面料状态模来源:hyperledger Fabric技术白皮书[2]
如上所述,fabric是一个通用区块链平台,业务目的不明确。事实上,在fabric的分类账模中,它与我们日常对财务账簿的理解没有直接关系。Ledger只是一个通用的kV存储模,可以存储任何数据。在fabric的实际使用中,如果没有领域模驱动,fabric实际上是一种分布式数据存储体系结构。
受这一因素的影响,我们实际上是利用fabric的全局状态存储世界状态来实现分布式存储链。我在其他文章中反复强调,如果区块链定位为分布式数据存储机制,与目前常用的分布式数据库相比,不会有任何技术优势,但实现更复杂,效率更低。
3、 数据共享与数据存储结构无关
通过以上分析,以fabric为代表的区块链通用平台可以定义为分布式数据存储模。但这种分布式存储机制能否带来数据共享和开放性?这里存在一个误区,这是我们片面的理解数据分布可以带来数据共享,但是本文要强调的是数据共享是否独立于存储结构和部署方式。
数据共享模式是数据存储模式,而数据存储模式是数据共享模式。目前,“数据即资产”以及个人隐私和商业数据安全的保护已经得到社会舆论的加强,决定数据是否共享的关键不是如何存储和部署数据,但数据共享的业务必要性和多个参与者的利益是否平衡和保障。简单地使用分布式存储机制来解决“信息孤岛”问题显然是非常棒的。
而且,大多数“信息孤岛”问题都是由数据的去中心化存储和管理引起的。可以说,数据的分布是现状,而不是未来。为了解决数据去中心化造成的“信息孤岛”问题,必须区分数据**的关系。在单一数据**(**数据**)的情况下,最有效的方法是数据集成,通过数据联盟、数据中间件和数据仓库实现数据聚合;在多方数据**(相对数据**)关系下,它是通过法律强制或业务模式驱动,使数据在数据应用相关方之间安全流动的前提下合法合规的移动。
在无法建立数据集成的环境中,如多方数据**、集成成本和法律约束,区块链技术确实可以用来建立一个可靠的可交易、移动和监管数据的数据共享网络。然而,区块链技术的应用重点不是分布式数据存储,而是数据资产的交易。如果不建立数据资产事务模,仅仅利用fabric的全局状态就无法实现数据共享。
事实上,以比特币为代表的经典区块链技术已经证明,区块链分布式节点的数据存储只是为了保证每个节点能够本地、高效地验证交易数据的真实性,而不是为了数据共享的最终目的。
4、 新技术驱动总是把哑铃效应放在首位
进入互联网Web2.0时代以来,一大批新技术、新概念、新术语涌入业界。从大数据、人工智能、5g、区块链到今年的量子计算,每一个新的技术和产业组合,都无法避免国内产业界技术认知的“哑铃效应”,即哑铃的一端高度概念化、抽象化,另一端则是高度实用的实例和工具。
区块链技术的兴起也是如此。一方面,区块链具有概念化和抽象化的特点。区块链是一种去中心化、网络自治的价值互联网,而不是中心化的系统;另一方面,区块链被描述为一个共享的数据库,一种分布式的存储工具。为什么我们会有这种认知?我认为主要原因是一项新技术的突然兴起往往是由几篇论文和几次应用场景引发的,但面向应用的广泛领域配套研究还没有完全跟进。通过采用高度概念化、抽象化或实例化、工具化的定义,映射关系总能在现实世界中找到,这是一条低成本的解释路径。
可以说,新技术开发的哑铃效应是一个必然的过程,但随着新技术在现场实践中的知识积累和模式沉淀,哑铃的两端会不断修正,使价值认知更加顺畅和实用。爱因斯坦说:“你不可能用制造问题的思维水平来解决这个问题。”。看新技术不能直接与现实相匹配和映射。相反,我们需要用创新的思维来开发和提高新技术在应用领域的定义和价值。
小结:
在一定程度上,区块链技术可以作为分布式数据库或数据共享机制使用,但在实际应用中,它与传统的数据集成框架相比没有优势。由于P2P技术具有较高的可维护性和可维护性,同时由于P2P技术具有较高的数据传输和可维护性。显然,仅仅为了建立一个分布式一致的存储机制而付出如此高昂的代价是不值得的,也没有实际的商业前景。区块链技术的运用需要注重构建分布式对等、安全、公平的交易环境,在优化数据交易环境的前提下,间接实现数据的充分共享和利用。可以说,在数据共享领域,区块链技术只是基础条件之一,并非**因素。在数据所有权去中心化的环境中,决定数据是否可以共享的最重要的是业务和业务模的建立。
文章链接:https://www.btchangqing.cn/147923.html
更新时间:2020年11月26日
本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。