互联网苦数据隐私久矣。
漫长的数据泛滥时代,成就了很多以数据为核心要素挖矿价值的平台和企业。而当用户、监管者意识到数据价值应该归于用户时,却已感到无力实现。
因为这将是一次用户、平台、监管者三方长期聚焦才能改变的持久战,更何况在意识到其重要性与制定规则、研发技术、落地之间,还隔着诺大的空洞。
在这样的背景下,区块链项目却向数据隐私发起了中心化式的挑战。
以同态加密、多方计算、可信执行环境、零知识证明等一系列技术为代表的区块链隐私计算项目,在尝试将数据保护起来,融合区块链的权益归属和激励方式,改变数据隐私现状。
《金色深核》栏目获悉,4月中旬,隐私计算网络PlatON将上线主网,在主网运行半年后,还会继续上线隐私计算层,将把隐私计算服务、数据发现等为数据搭建的服务流程上线。
PlatON团队中心化了金融、密码学、数据服务、公链等多背景研究人才,以解决数据隐私为目标,已聚焦于将关于数据的协议根据法规细化,详细区分数据流通过程的所有权定义。
而为了将网络性能提升至为数据隐私所用,PlatON对网络的设计也极有特色,从PlatON的第一版白皮书中可以发现,整个网络结构分为了3层,包含区块链总帐本的layer1、隐私计算层layer2、跨链输出层layer3。主网上线的时间会成为整个架构启用的开始。
PlatON主网结构里的layer1和layer2
此前,为了金融数据领域的尝试,在2020年8月,PlatON上线了先行测试网Alaya,该网络聚焦于金融数据层面的测试。而PlatON主网将代表着对更广泛数据服务的开始。
PlatON很早就进入了《金色深核》栏目的研究视野,在主网上线之前,为了更详实的了解PlatON的部署,《金色深核》栏目策划人王航与PlatON CTO曲俊杰进行了深度对话,对网络功能分配、网络设计、隐私计算面向数据的范式实现等进行了探讨。
在本文中,你将获取到以下关键信息:
1.Alaya先行网对金融领域的偏向性会更强。而PlatON主网对layer2隐私计算层偏向会更强;
2.PlatON的layer2不只是为了扩容;
3.主网上线半年左右,PlatON网络会推出隐私计算层。
4.PlatON在通过数据、算力的隐私保护模去定义出一个“面向数据的计算方式”。
5.PlatON在安全计算硬件上已经有很大突破,对于现阶段的公开算法提高了100倍左右。
6.因为数据种类繁多,属性复杂,PlatON正在用复杂的协议去定义数据法规的细节。
PlatON CTO 曲俊杰
以下为对话实录,经《金色深核》栏目整理,力求还原对话过程中的精彩部分,以飨读者。
Alaya与PlatON
《金色深核》栏目策划人王航:
第一个问题关于Alaya与PlatON,PlatON主网即将上线,但此前已经先发布了Alaya先行网,为什么要分主网和先行网?
这样的安排,是否很像Kusama先行网和Polkadot主网的部署,两个网络的功能作用是如何分配的?
PlatON CTO 曲俊杰:
以Kusama和Polkadot做比喻,有类似的地方,也有完全不一样的地方。
类似的地方是,一个是先行测试网,一个是主网。不同的是,Alaya是侧重金融基础设施的SandBox,PlatON要做隐私计算网络和分布式经济基础设施,其核心是对数据做隐私计算处理,而数据是多种多样的,在数据类别里,金融数据是比较成熟完善的,所以对SandBox(Alaya)来讲是个很好的落地的实验对象。
所以,Alaya是一个聚焦金融的SandBox和先行示范区,会成为各种新功能和新实验的区域。
PlatON是我们的主目标,是未来的隐私计算网络和分布式经济基础设施,今年在主网推出之后,再过半年左右的时间,PlatON会再次推出一个隐私计算层,这个计算网络里会包含服务发现、数据发现、算力发现等等。
重新定义layer1、2、3
《金色深核》栏目策划人王航:
那Alaya对金融领域的偏向性会更强。PlatON对layer2隐私计算层偏向会更强。
PlatON CTO 曲俊杰:
可以这么说,不过关于layer2的定义,我也想跟你探讨一下。
的确我们现在有layer1、2甚至layer3的定义。但其实这些是上一代区块链生态的一种定义。
例如以太坊生态里的layer2主要为了扩容,我们已经在Layer1做到了,我们的layer2很明显并不是为了扩容。是着眼于数据,着眼于隐私分布式计算。
所以现在定义的分层是传统视角,在PlatON的世界里,我们希望重新定义layer1、2,甚至可以没有layer1、2,是一个整体的区块链基础设施,它包括了记账、共识治理等等,是经济和生态建立的基础。
另外,传统对于layer3也没有一个准确的定义,我认为我们的layer3,更准确的描述是把隐私的功能,通过类似跨链协议的方式,输出给其他的公链和生态。
以此去重新定义layer1、2、3。
《金色深核》栏目策划人王航:
此前在全面了解PlatON的时候,看到了咱们的文档叙述里面,有一个layer3的定义,但我发现layer3的这一层的特性,包含了子链模块和多链模块。
对比后发现,它似乎很像是一个偏向于为应用层提供的SaaS(主要提供隐私能力输出)。
而再看layer2,像您说的并没有完全用 layer 2扩容,layer2的特性是包含多方计算的隐私计算层和巨大的算力集成。
这个部分很像云计算架构里面的中间层部分。
**layer1是一个区块链的总账本。
所以我认为用123这种传统分层的方式,确实不够清晰,可能会在功能上产生混淆。更好的理解应该是站在将它定义为一个面向服务的云架构,区块链层就是IaaS,layer2就是PaaS,上层就是SaaS,我认为值得用这样的方式对比理解。
PlatON CTO 曲俊杰:
layer分层概念是我们的第一版白皮书为主解析出来的。现在区块链行业迭代因为open source的特点发展非常快,我们也认为该进一步梳理类似像刚才提到云服务架构这些。
此外,平台还包含存储、算力等。
SaaS PaaS都是比较成熟的概念,我们可以把算力、存储通过新的模式最终抽象成为一个隐私数据的分布式计算平台。
如果对比传统云架构,PlatON也具备优势。
在云架构里,很难合理的去按照经济模去分配各方的贡献。而PlatON是通过数据、算力的隐私保护模定义出一个叫做面向数据的计算方式。
就像区块链和数据库的对比,
区块链的把这种分布式数据库和经济模、治理模结合在一起。而PlatON希望把现有的云服务架构的概念拆分之后,启用新的面向数据的计算形式。可能是通过一种新的协议、算法变成另外一种维度的重新组合。
PlatON 的数据隐私是如何塑造的?
《金色深核》栏目策划人王航:
明白。我有一个思考。这中隐私数据服务的范式。如果to c就是APP,to b的就是服务,在应用端,是不是会割裂的比较严重?最终发展博弈后,可能会比较偏向to b,或者形成企业Service平台?
PlatON CTO 曲俊杰:
你的这个问题问的很好。我们的思考是to c也罢,to b也罢,甚至还有to g。
从PlatON角度上分析,它的核心是数字时代数据该怎么办?在数据处理维度上的三者关系(数据提供方、平台、监管方)到底该如何去重新定义?如何变成一个更好的更健康的关系?
c端大众,是原数据的提供方。平台是把数据计算后挖矿出价值。而监管方可能会主导某些发展方向,因为某些数据里边会有公共数据。
而且将来数据产生不限于c端,未来各种机器,这些数据的所属权,他们和它们的利益,应该归属谁。
《金色深核》栏目策划人王航:
明白,那就是重新定义、制定数据所有权的具体规则。
相比其他项目,大多是实现数据做可用而不可见,这种对权益的拆分和数据本身的归属性拆分完成的并不详细。
这种范式和标准,我想到您原来说过一个词汇,叫多元异构数据流动的标准化,如果这种范式可以嵌入标准化的流程里,就像形成一个通用语言一样,可以部署到任何的位置,通过一个简易的SDK接入,就可以实现对这种范式的部署。
PlatON CTO 曲俊杰:
是的,我们的确希望通过实际商用落地逐渐把它定义清楚。
《金色深核》栏目策划人王航:
我还详细的问一下,像您刚才说的,如果一份数据,然后它是属于APP还是属于用户,还是属于平台?
这种定义有没有实现的demo,或者这种范式的基础标准。
PlatON CTO 曲俊杰:
协议的实现我们正在一步步推进。
原则上,首先要保证数据隐私,例如数据可用不可见。先把数据保护起来。另外是把权益和数据结合,我们已经尝试发布了一个隐私token协议。
因为数据种类繁多,属性复杂,需要用很复杂的协议去定义,需要不停的修订以保证保证数据权益**落地,落地在不同的国家、政体,符合不同的法律法规。这个部分挑战很大。
例如欧洲 GDPR,其定义数据权益里有一条是可遗忘性,也就是说这个数据的所有方要求删除,你必须彻底干净的删除,不删除就涉及违法。
为了实现以上的需要,数据的定义协议需要有2个特点:
1.足够通用
2.具备灵活的可调整的空间
所以需要全面考虑协议框架怎么做。以身份举例,PlatON在参与 W3C国际标准的did身份制定,包含身份该怎么管理、怎么授权等。
**,还要注意,在很多领域里,还会有一些特殊的部分。
例如金融是一个难真正落地的领域,第一与钱相关,任何创新都可能造成投资者损失。第二具有高度的法律法规保护。这些会造成有些创新难度,建议法律上开辟蹊径,例如SandBox,政府规定在SandBox里可以有相当程度的创新。
不过,我们坚信在金融领域里一定会有翻天覆地的好应用,把资金的流动、风险管控、投资者保护等这些传统金融费了很大的人力、财力、时间去做的东西,非常简洁的、可靠的做出来。
PlatON网络的并行能力
《金色深核》栏目策划人王航:
那PlatON的并行计算是如何体现的呢?现在算力,会局限于什么?
PlatON CTO 曲俊杰:
这块简单点讲是因为隐私计算有很多种。
一部分算法非常复杂,极度占用计算资源,另一部分其过程对数据的处理,需要反复多次传输、加密后再组合。
所以这几部分很适合做并行计算的处理,很早时。我们研发了一套语言,能够把安全多方计算的公式编译成门电路。
门电路的优势在于有前后逻辑关系就可以形成有向无环图DAG,实现之后,并行计算就不是问题了。
另外并行计算还体现在,为了快速验证所有默克尔树之间的逻辑关系,二叉树等结构可以拆分验证,并行计算完成后再根据密码学算法把**两个节点合起来。但不是所有的都可以并行。
《金色深核》栏目策划人王航:
明白。我觉得可以理解为每一个计算电路,都是分片。
PlatON CTO 曲俊杰:
可以这么理解,只是分场景去实现。
《金色深核》栏目策划人王航:
您刚才说的门电路是跑在什么的设备里呢?硬件给予什么样的能力呢?
PlatON CTO 曲俊杰:
我们现在的硬件已经有很大的突破,比现在的市面上公开的算法提高了100倍左右,也优于微软。
这样的性能,的确是因为我们在硬件上做了一些尝试,但因为不同场景带来的密码学算法复杂度不同,其算法本身会有限制。
而数据计算时,除了GPU和带宽外,有些算法可能只适合100条数据和另一方1000条数据做协同计算。
一旦是2个G的数据和另一方10个G的数据协同计算,就完全不能商用了。
我们在做的是,****的组合优化,根据不同的数据复杂度和算法复杂度、通讯复杂度,在不同的场景里不同的密码学算法接力计算,**完成**级的效果。
《金色深核》栏目策划人王航:
除了PlatON,我知道还有一个解决方案是PlatONE,两者在计算资源上有共享吗?
PlatON CTO 曲俊杰:
我们是以PlatON为主, PlatONE的是使用PlatON DNA的联盟链。
如果PlatONE有数据,有算力或者是有好的模想共享开放出来,可以作为可以PlatON的子链,把它的能力发布到链上,供其他人发现使用。
所以资源共享,其实是一主一辅的关系,不是单纯的共享。
PlatON 架构设计的小故事
《金色深核》栏目策划人王航:
咱们刚才聊的整体看下来,我觉得是很符合工程化思维的,为了去实现数据隐私计算的工程目标,借鉴整合了多个部分,然后把它组合到一起。
例如在咱们整体的架构里面,可以看到云计算架构的设计,看到分层的设计,看到跨链,看到算力的管理和输出,那PlatON内部是怎么去推进开发过程的?从开发讨论到实施的推进流程什么样的?
PlatON CTO 曲俊杰:
这个行业是比较新的,经常有新的输入,通过内部的学习讨论,可能会此前的一些方案给颠覆掉。
我们内部例如肖总、孙总,他们在战略级别会有很多洞见。
我们非常坚定的大方向是数据隐私、分布式AI。
而一直持续的修订过程会来自于PlatON的各种专家团队、技术生态委员会、生态发展委员会等。
核心团队还会与外部专家有一些定期的沟通。包括美国、新加坡、香港,日本,中国的合规应用有什么动向?密码学研究有没有新的实现,如何优化?硬件是否能优化等等。
《金色深核》栏目策划人王航:
插问您一个小问题,PlatON什么时候开始确认整个架构设计的?
PlatON CTO 曲俊杰:
我们的整体架构在第一版白皮书就定义清楚了。
此前有过很深度的封闭讨论,被称作香山会议,讨论的内容例如包括要做计算的解耦,使用双层结构。
《金色深核》栏目策划人王航:
我知道PlatON 有非常庞大的密码学团队,关于密码学团队的工作状态是什么样的?
PlatON CTO 曲俊杰:
他们的自由度是非常高的,想研究什么都可以,只要出成果,只要能为整个社区做贡献就可以。
我们会从工程方面出命题,固定某个场景。有趣的是,有时候团队会告诉你这个做不了,但是过几天又告诉你,也许能做,可以这样做尝试。
对于某个单独的场景,一般会有多个研究方向,只要有一个方向突破了,就可以用了。
《金色深核》栏目策划人王航:
**一个观点性的问题,外界对可编程电路的成本比较担心,那可编程电路的成本,目前来说是可控的吗?
PlatON CTO 曲俊杰:
我的观点是这样,如果是指 MPC相关的成本,假如在APP里实现,数据怎样进行隐私计算,电路的价值和使用频度相关。只要是使用频度高,有相当的价值体现点,成本就不是问题。
因为这些硬件还没有大规模商用,所以现在都是处于烧钱研究的状态。从我们基金会的角度来讲,暂时不考虑成本问题。
而对于商用来说,我们的确会考虑如何把这个问题做解耦,可能通过尽量做到模块化、通用化,可以实现固定成本,具体实现还有待研究。
当解耦和模块化的实现到达一定成熟程度,又有落地场景的价值覆盖成本,那个时候,成本问题只会是一时的。
文章标题:金色深核|对话PlatON曲俊杰:如何定义新的数据计算形式?
文章链接:https://www.btchangqing.cn/225753.html
更新时间:2021年04月05日
本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。