当前位置:首页区块链反思“数据就是石油”:隐私计算如何保护数据主权?

反思“数据就是石油”:隐私计算如何保护数据主权?

就连参加2020年美国总统大选的华裔民主党候选人***(Andrew Yang)也表示,“数据比石油更有价值”,这说明这一理念根深蒂固。

反思“数据就是石油”:隐私计算如何保护数据主权?

然而,尽管说“数据是数字时代的石油”和“我们应该把数据的所有权掌握在自己手中”听起来很有吸引力,但很难说我们应该如何实现这一目标。

早在2017年,券商学者就发表封面文章,称“数据将取代石油”,成为时代最宝贵的资源。但即使在今天,拥有“数据油”**的普通民众仍然无法从这一宝贵资源中获益。

相反,这些数据也给其所有者带来了严重的隐私泄露问题。

为什么愿景和现实之间有巨大的差距?如何实现数据所有权和数据价值?本文试图从现有的实践中进行探索,希望能厘清一些线索,有助于建立关于这一问题的思考框架。

反思“数据就是石油”:隐私计算如何保护数据主权?1

我们不能卖数据

我相信我们每个人都有接到销售电话的经验。绝大多数人的个人资料都被买卖过,最简单的如电话号码和一些消费者信息,这些资料目前可能正在某处等待再次出售。

数据确实能卖钱,而且钱会进入有权访问我们数据的机构的口袋。

这种现象容易导致一种误解,即我们可以通过出售数据来实现数据的价值。也就是说,在我们有了数据**之后,借助法律规定和技术手段,我们可以通过把这些数据卖给有需要的人来获得数据价值,把“石油”卖成金钱。

但这是错误的。我们不能买卖数据。在阐述这一问题之前,有必要区分数据的所有权和使用权。

对世界上绝大多数资产而言,买卖行为是指资产所有权的转移:一方取得所有权,另一方丧失所有权。但买卖数据不会转移数据的所有权。您出售数据,但数据的所有权仍然属于您。

因此,围绕数据的交易实际上是围绕数据的使用权,而不是围绕数据所有权的交易。但由于数据可以无限**,如果我们出售数据,就不能保证买家会如何使用,是否会再次出售。更准确地说,在某种程度上,我们已经“丢失”了数据,即使我们拥有数据的所有权。

非法数据交易将直接买卖数据,因为他们不关心数据所有者的权益。然而,当我们真正拥有数据的所有权时,我们不能为了实现数据的价值而买卖数据。

那么,如何在不丢失数据的情况下交易数据使用权呢?答案不是交易数据本身,而是交易数据的计算结果。也就是说,买方可以用这些数据来计算并得到所需的结果,但买方自己不能得到原始数据。

这是我们讨论数据所有权和数据价值时首先要理解的,也许也是最重要的一点:我们不能通过销售数据来实现数据价值,我们只能通过销售数据结果来实现数据价值。

也就是说,我们应该把数据的所有权和使用权分开,只交易数据的使用权。

隐私计算不仅仅是针对用户的隐私问题

如何实现只卖数据结果?答案是:通过隐私计算。

隐私计算是在不暴露原始数据的情况下对数据进行计算,并对计算结果进行验证。它包括许多研究方向,如完全同态加密、安全多方计算等。有许多专业技术。本文介绍了它们的工作原理。如果你想了解更多,你可以查一下。

这里我们还有第二个模糊的方面要澄清,即隐私计算不仅仅是为保护用户隐私而服务的,它是实现数据使用权交易的基础,也就是实现数据价值的基础。

之所以要澄清这一点,是因为“隐私计算”很容易被理解为另一种保护隐私的技术,重点是“隐私”。但实际上,“隐私计算”的焦点是“计算”。

区块链行业,由于隐私计算经常被用作加密货币交易和区块链中增强用户隐私的一种方法,因此人们更容易将隐私计算理解为对用户隐私的一种服务。这种理解并没有错,但它将隐私计算局限于一个小领域。

或许从另一个角度来看待这个问题更为清晰。将数据问题分为用户隐私问题和数据价值问题。用户隐私的问题是与用户有关的原始数据不被披露,用户的隐私不被暴露。我们可以把这一问题看作是一种特定范围内的数据隐私保护。

在这个阶段,隐私计算的作用是保护隐私的另一种方式。

在用户获得数据隐私后,如果他/企业选择将数据放在那里而不做任何事情,故事就结束了;但如果用户/企业想走得更远,获得数据的价值,就需要把数据拿出来使用,事情就会进入下一个阶段。在这个时候,我们需要使用各种方法来确保数据在使用的整个生命周期内不会被泄露。我们可以将此视为全方位的数据隐私保护。

在这一阶段,隐私计算的作用不再是一种替代方法,而是一种必要的方式,因为实现数据价值的方式是在不暴露原始数据的情况下出售数据的结果,并交易数据的使用权。只有隐私计算才能实现这一目标。

如果我们把数据比作石油,那么隐私计算就是提炼的第一步。这是我们在保证用户隐私的前提下,将“原油”转化为各种产品的基础。

并非所有数据都具有相似的值

不是所有的数据都有相似的价值,也不是所有的数据都能实现数据价值。这可能是我们在讨论数据值时需要明确的另一点。

只有了解数据的复杂性和多样性,才能在不同的情况下运用法律和技术中不同的术语和方法来解决问题。

本文试图从应用的角度对数据类别进行简单的划分,然后介绍这类数据的数据价值。本文提出的数据分类方法并不一定全面、准确,而是为讨论建立了一个基本框架。

我们可以将数据分为三类:

一是身份数据;

二是行为数据;

第三类是生产力价值数据。

第一类身份数据用于网络和现实世界中的注册和身份认定,如身份证号码、电话号码、账户信息等。这些信息对非法行业的价值**。一旦泄露,也会给用户带来极大的安全隐患。但对于正规的数据行业来说,这种信息没有计算价值,无法计算出有意义的结果。

因此,这类数据本身不需要考虑如何通过隐私计算实现数据价值。

第二类是行为数据,包括用户在互联网上的浏览痕迹和消费数据,以及用户的产品使用习惯等。我们可以计算这些数据来制作用户的个人肖像,然后根据肖像向用户推送广告、推送内容、提供服务,甚至销售创意。

行为数据有两种价值。一是广告的价值。我们都知道广告几乎支撑了整个互联网产业;其次,它可以帮助产品了解用户,从而为用户提供更好的个性化服务。

目前,国际上广泛关注和讨论的数据所有权问题主要中心化在这类数据上。长期以来,这类数据的权利并不明确,人们对此并不关心。直到这些数据的计算结果越来越多地被用来影响或控制我们,我们才意识到问题的严重性。

标志性事件是2018年;Facebook;的数据门事件。在这次事件中,一家名为Cambridge *ysis的数据运营公司从超过5000万Facebook用户那里获得了数据。他们通过数据计算,筛选出政治摇摆的对象,并在其上投放准确匹配的政治广告,从而影响美国大选和英国脱欧公投。

反思“数据就是石油”:隐私计算如何保护数据主权?2

好消息是,我们似乎正在收回这类数据的所有权。根据欧盟发布的《通用数据保护条例》(gdpr),生成数据的个人是数据主体,他有权要求删除他的个人数据,也有权反对和停止处理他的个人数据。

坏消息是我们得不到使用这些数据的权利。如上所述,数据的价值是建立在数据使用权交易的基础上的,所以我们离用这类数据来实现属于用户的数据价值还很远。其困难在于:

一方面,尽管gdpr被称为史上最严格的数据保**规,但gdpr只要求企业在使用数据之前告知用户使用了哪些数据以及如何处理这些数据。也就是说,它只限制企业滥用数据,而不限制企业使用数据。

另一方面,由于这类数据可以帮助产品了解用户,如果企业为了改善用户体验而使用数据,这也是他们现在所做的,似乎很难拒绝。用户牺牲用户体验要求企业不使用任何行为数据似乎非常困难,但企业主动区分这类数据的两种用途并转移部分广告价值似乎更为困难。

反思“数据就是石油”:隐私计算如何保护数据主权?3

这是否意味着企业仍然可以像以前一样行事?一点也不。我们会发现,上述数据所有权和使用权的分离只是字面上的。企业虽然只拥有数据的使用权,但他们“获取”并使用原始数据本身,使得数据仍然存在滥用和安全问题。

由于公众隐私意识的觉醒和各国数据保**的出台,一旦出现问题,企业可能面临用户**和巨额罚款。因此,我们可以看到,谷歌、苹果等公司都在隐私计算领域做了大量的研究。

与;谷歌;例如,它的“联邦学习”就是将机器学习模集成到每个设备中,在采集用户参数并发送到云端时,通过隐私保护聚合算法和系统工程实现隐私计算。

但需要再次指出的是,企业通过隐私计算将数据所有权和使用权分离,并不是为了让用户能够交易数据使用权。他们希望降低数据使用的风险,避免隐私泄露的指控,继续****用户的数据,以满足法规遵从性要求。

因此,用户获取此类数据的数据价值任重道远,而**的困难在于感知。只有当我们有了强烈的数据所有权和使用权意识,才能推动政府出台更加严格的数据保**规,或者推动新的互联网架构颠覆当今的中心化式服务器模式。

“生产力价值数据”是最有价值的

在理解了“身份数据”和“行为数据”之后,我们将介绍第三类数据,本文称之为“生产力价值数据”。

这类数据的主要用途之一是进行机器学习和人工智能训练;另一个主要用途是做数据分析,帮助科学研究、产品设计、决策等。如果使用得当,这种数据可以推动社会朝着更高效、更友好的方向发展。他们是一种生产力。

第三类数据收集范围最广,数据量**。它可以来自人类,如个人医疗数据和财务数据、个人产品使用数据等;它还可以来自物联网设备,如传感器采集的大气数据、自动驾驶数据等。

其部分数据来源与第二类数据相同,都是互联网产品的用户,但采集数据的处理方法和用途不同:第二类数据取自用户,用于用户,第三类数据采集后跨数据主体使用。从数据本身来看,我们可以认为某一数据不仅是第二类数据,也是第三类数据。

第三类数据具有**的数据价值。同时,可以率先进入数据使用权交易市场,实现数据价值。

与第二类数据不同的是,互联网企业拥有数据使用权,同时使用数据,不需要进行数据交易。在生产力价值数据的应用场景中,有一些角色没有使用数据的权利,但是想要使用数据。从这个角度来看,我们可以认为第三类数据是指所有可以资本化的数据的集合。

我们可以以医学数据为例,更好地理解如何使用第三类数据。如果科研机构或制药厂能有大量的医学数据支持,就能更好更快地研究疾病、开发新药。但是,有数据资源的医疗机构由于用户隐私问题和自身利益,不会将这些数据提供给其他机构。

如果我们通过隐私计算分离数据的所有权和使用权,就可以建立一个数据使用权交易市场,不同医疗机构的数据,科研机构和制药厂可以在这个平台上互联互通——俗话说就是打破数据孤岛——这些机构可以进行数据交易,数据也可以共享用于关节病研究。

要培养出能够诊断疾病的人工智能,还需要通过上述方式打破数据孤岛,为人工智能提供越来越全面的数据。

需要重申的是,在现阶段,即使实现了数据的交易和价值,但由于数据使用权的法律和使用界限尚不明确,我们作为个人仍然难以收回数据的全部价值。

数据所有权和访问权是这个时代最重要的问题之一。《人类简史》的作者和历史学家尤瓦尔·诺亚·哈拉里(Yuval Noah Harari)认为,“如果我们想避免财富和权力中心化在一小群精英手中,关键是要规范数据获取。”。

由于数据本身的复杂性和多样性,与其依靠舆论、立法和技术整体解决问题,不如从边界清晰、描述准确的小点来界定和解决问题,或许是一种快速有效的方法。我们可以对不同的数据类别进行更具体的分类和分析,或者用不同的分类标准来讨论数据的分类,然后在此基础上讨论数据的隐私性、所有权和价值实现。

重新认识“数据就是石油”

数据常常被比作石油。

尽管有人类在死海沿岸采集楔形文字的天然石油的记录,但直到1846年亚伯拉罕·蒂斯纳发明了从煤中提取煤油的方法,1853年伊格纳齐·武卡谢维奇和扬·塞从原油中分馏出精制煤油,现代石油工业的历史才真正开始。

然而,这仅仅是开始。作为煤油灯的燃料,油并不特殊。后来在内燃机上使用,才迸发出巨大的潜力,成为世界上最重要的资源。

数据和石油之间的相似之处在于仅仅数据是不够的。只有实现数据的“提炼技术”,才能开启数据产业时代。

数据和石油的区别在于,只有在炼油厂之后才有对内燃机的需求。然而,对数据的需求巨大,但没有成熟的技术和基础设施来支持这一需求。

这也许是件好事。路很长,但我们知道方向。

标准物质:
。联合学习:没有中心化训练数据的协作机器学习
2。帮助组织在不收集更多数据的情况下做更多工作

温馨提示:

文章标题:反思“数据就是石油”:隐私计算如何保护数据主权?

文章链接:https://www.btchangqing.cn/248047.html

更新时间:2021年05月01日

本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。

区块链行情

于集鑫:比特币多头上攻震荡走高 以太坊承压2800盘整蓄力

2021-5-1 19:45:11

GameFiNFT元宇宙区块链

NFT内幕:bape出售NFT,毕加索艺术已完成NFT

2021-5-1 19:59:45

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索