互联网苦数据隐私久矣。
漫长的数据泛滥时代,成就了很多以数据为核心要素挖掘价值的平台和企业。而当用户、监管者意识到数据价值应该归于用户时,却已感到无力实现。
因为这将是一次用户、平台、监管者三方长期聚焦才能改变的持久战,更何况在意识到其重要性与制定规则、研发技术、落地之间,还隔着诺大的空洞。
在这样的背景下,区块链项目却向数据隐私发起了集中式的挑战。
以同态加密、多方计算、可信执行环境、零知识证明等一系列技术为代表的区块链隐私计算项目,在尝试将数据保护起来,融合区块链的权益归属和激励方式,改变数据隐私现状。
《金色深核》栏目获悉,4月中旬,隐私计算网络PlatON将上线主网,在主网运行半年后,还会继续上线隐私计算层,将把隐私计算服务、数据发现等为数据搭建的服务流程上线。
PlatON团队集中了金融、密码学、数据服务、公链等多背景研究人才,以解决数据隐私为目标,已聚焦于将关于数据的协议根据法规细化,详细区分数据流通过程的所有权定义。
而为了将网络性能提升至为数据隐私所用,PlatON对网络的设计也极有特色,从PlatON的第一版白皮书中可以发现,整个网络结构分为了3层,包含区块链总帐本的layer1、隐私计算层layer2、跨链输出层layer3。主网上线的时间会成为整个架构启用的开始。
PlatON主网结构里的layer1和layer2
此前,为了金融数据领域的尝试,在2020年8月,PlatON上线了先行测试网Alaya,该网络聚焦于金融数据层面的测试。而PlatON主网将代表着对更广泛数据服务的开始。
PlatON很早就进入了《金色深核》栏目的研究视野,在主网上线之前,为了更详实的了解PlatON的部署,《金色深核》栏目策划人王航与PlatONCTO曲俊杰进行了深度对话,对网络功能分配、网络设计、隐私计算面向数据的范式实现等进行了探讨。
金色午报 | 11月16日午间重要动态一览:7:00-12:00关键词:V20峰会、BCHA、以太坊2.0、DOT
1.V20峰会即将举行主要议题为稳定币和DeFi监管;
2.以太坊2.0存款合约地址余额突破9万枚ETH;
3.BCH完成硬分叉Bitfinex上BCHA最低跌破10美元;
4.研究:波卡区块链上质押的DOT代币价值近30亿美元;
5.索尼音乐与区块链通证公司合作布局代币经济业务;
6.V神:以太坊比其他任何加密项目都更加重视共享安全;
7.加密庞氏局OneCoin主要发起人之一因合作被延缓判刑。[2020/11/16 20:56:24]
在本文中,你将获取到以下关键信息:
1.Alaya先行网对金融领域的偏向性会更强。而PlatON主网对layer2隐私计算层偏向会更强;
2.PlatON的layer2不只是为了扩容;
3.主网上线半年左右,PlatON网络会推出隐私计算层。
4.PlatON在通过数据、算力的隐私保护模型去定义出一个“面向数据的计算方式”。
5.PlatON在安全计算硬件上已经有很大突破,对于现阶段的公开算法提高了100倍左右。
6.因为数据种类繁多,属性复杂,PlatON正在用复杂的协议去定义数据法规的细节。
PlatONCTO曲俊杰
以下为对话实录,经《金色深核》栏目整理,力求还原对话过程中的精彩部分,以飨读者。
Alaya与PlatON
《金色深核》栏目策划人王航:
第一个问题关于Alaya与PlatON,PlatON主网即将上线,但此前已经先发布了Alaya先行网,为什么要分主网和先行网?
这样的安排,是否很像Kusama先行网和Polkadot主网的部署,两个网络的功能作用是如何分配的?
金色财经挖矿数据播报 | BTC今日全网算力下降4.51%:金色财经报道,据蜘蛛矿池数据显示:
BTC全网算力113.064EH/s,挖矿难度19.99T,目前区块高度655066,理论收益0.00000767/T/天。
ETH全网算力267.162TH/s,挖矿难度3319.49T,目前区块高度11174806,理论收益0.00595503/100MH/天。
BSV全网算力1.307EH/s,挖矿难度0.20T,目前区块高度659480,理论收益0.00068885/T/天。
BCH全网算力2.234EH/s,挖矿难度0.32T,目前区块高度659722,理论收益0.00040277/T/天。[2020/11/2 11:24:39]
PlatONCTO曲俊杰:
以Kusama和Polkadot做比喻,有类似的地方,也有完全不一样的地方。
类似的地方是,一个是先行测试网,一个是主网。不同的是,Alaya是侧重金融基础设施的沙盒,PlatON要做隐私计算网络和分布式经济基础设施,其核心是对数据做隐私计算处理,而数据是多种多样的,在数据类别里,金融数据是比较成熟完善的,所以对沙盒来讲是个很好的落地的实验对象。
所以,Alaya是一个聚焦金融的沙盒和先行示范区,会成为各种新功能和新实验的区域。
PlatON是我们的主目标,是未来的隐私计算网络和分布式经济基础设施,今年在主网推出之后,再过半年左右的时间,PlatON会再次推出一个隐私计算层,这个计算网络里会包含服务发现、数据发现、算力发现等等。
重新定义layer1、2、3
《金色深核》栏目策划人王航:
那Alaya对金融领域的偏向性会更强。PlatON对layer2隐私计算层偏向会更强。
PlatONCTO曲俊杰:
可以这么说,不过关于layer2的定义,我也想跟你探讨一下。
的确我们现在有layer1、2甚至layer3的定义。但其实这些是上一代区块链生态的一种定义。
例如以太坊生态里的layer2主要为了扩容,我们已经在Layer1做到了,我们的layer2很明显并不是为了扩容。是着眼于数据,着眼于隐私分布式计算。
金色晚报 | 今日重要动态一览:1.最高检:严肃查办各类非法集资案件
2.外交部部长助理陈晓东:将与东盟一起深化区块链等领域合作
3.国家电网董事长寇伟:加强能源电力区块链标准体系研究编制
4.英属维尔京群岛将推出自己的中央银行数字货币
5.WisdomTree推出比特币ETP,将在瑞士证券交易所SIX上线
6.中国经济周刊:IDAX 438名投资人 合计受损金额超5000万元人民币
7.平安金融壹账通、蚂蚁金服入选首批“十三五”金融行业示范案例
8.腾讯金融云总经理:区块链技术将帮助供应链金融行业构建信任基石
9.德商行、瑞士信贷和瑞银在德意志交易所旗下证券借贷平台进行首次基于DLT的交易
10.BTC全天窄幅震荡,今日最低跌至7238美元,最高涨至7400美元[2019/12/3]
所以现在定义的分层是传统视角,在PlatON的世界里,我们希望重新定义layer1、2,甚至可以没有layer1、2,是一个整体的区块链基础设施,它包括了记账、共识治理等等,是经济和生态建立的基础。
另外,传统对于layer3也没有一个准确的定义,我认为我们的layer3,更准确的描述是把隐私的功能,通过类似跨链协议的方式,输出给其他的公链和生态。
以此去重新定义layer1、2、3。
《金色深核》栏目策划人王航:
此前在全面了解PlatON的时候,看到了咱们的文档叙述里面,有一个layer3的定义,但我发现layer3的这一层的特性,包含了子链模块和多链模块。
对比后发现,它似乎很像是一个偏向于为应用层提供的SaaS。
而再看layer2,像您说的并没有完全用layer2扩容,layer2的特性是包含多方计算的隐私计算层和巨大的算力集成。
这个部分很像云计算架构里面的中间层部分。
最后layer1是一个区块链的总账本。
所以我认为用123这种传统分层的方式,确实不够清晰,可能会在功能上产生混淆。更好的理解应该是站在将它定义为一个面向服务的云架构,区块链层就是IaaS,layer2就是PaaS,上层就是SaaS,我认为值得用这样的方式对比理解。
金色独家 数字彗星创始人张东谊:区块链企业从四个方面提升安全:金色财经独家专访,针对近期热议的安全问题, 数字彗星创始人张东谊指出:目前区块链创业者、从业者、数字货币持有者的区块链安全意识是不够的,安全是个非常庞大的系统架构,其中包括系统安全、网络安全、代码安全、通信安全、中间件安全、业务安全,涵盖面很广。区块链企业应该从:a.使用专业的代码审计服务;b.熟悉安全编码规范,严进宽出规则;c.密码算法的安全性;d.多人代码审核、内部测评小组、外部专家评测,白帽黑客激励机制等四个方面提升安全性。安全是个相对的概念,没有绝对的安全,安全的本质是信任问题。企业应该做好边界的安全,提升入侵检测和应急响应的能力。[2018/6/18]
PlatONCTO曲俊杰:
layer分层概念是我们的第一版白皮书为主解析出来的。现在区块链行业迭代因为opensource的特点发展非常快,我们也认为该进一步梳理类似像刚才提到云服务架构这些。
此外,平台还包含存储、算力等。
SaaSPaaS都是比较成熟的概念,我们可以把算力、存储通过新的模式最终抽象成为一个隐私数据的分布式计算平台。
如果对比传统云架构,PlatON也具备优势。
在云架构里,很难合理的去按照经济模型去分配各方的贡献。而PlatON是通过数据、算力的隐私保护模型定义出一个叫做面向数据的计算方式。
就像区块链和数据库的对比,
区块链的把这种分布式数据库和经济模型、治理模型结合在一起。而PlatON希望把现有的云服务架构的概念拆分之后,启用新的面向数据的计算形式。可能是通过一种新的协议、算法变成另外一种维度的重新组合。
PlatON的数据隐私是如何塑造的?
《金色深核》栏目策划人王航:
明白。我有一个思考。这中隐私数据服务的范式。如果toc就是APP,tob的就是服务,在应用端,是不是会割裂的比较严重?最终发展博弈后,可能会比较偏向tob,或者形成企业Service平台?
PlatONCTO曲俊杰:
金色财经现场报道,Franklin Song:数据应该实现可编程的信任、可编程的资产:在2018年世界数字资产峰会(WDAS)暨FBG年会上,来自DATA公司的Franklin Song表示,当前数据生态系统是区块链系统的中心,数据的生产者、消费者、处理者在整个系统中扮演不同的角色。其中超过40%的广告流量来自数据拥有者,产生大约为160亿价值,但数据所有者很少从中得到激励来使用数据,这也导致广告的效用也越来越低,目前有6亿的设备用于阻碍广告弹出服务。由此看,现在数字生态系统上还比较支离破碎,人们没有得到自己数据应有的回报,数据应该实现可编程的信任、可编程的资产。[2018/5/2]
你的这个问题问的很好。我们的思考是toc也罢,tob也罢,甚至还有tog。
从PlatON角度上分析,它的核心是数字时代数据该怎么办?在数据处理维度上的三者关系到底该如何去重新定义?如何变成一个更好的更健康的关系?
c端大众,是原数据的提供方。平台是把数据计算后挖掘出价值。而监管方可能会主导某些发展方向,因为某些数据里边会有公共数据。
而且将来数据产生不限于c端,未来各种机器,这些数据的所属权,他们和它们的利益,应该归属谁。
《金色深核》栏目策划人王航:
明白,那就是重新定义、制定数据所有权的具体规则。
相比其他项目,大多是实现数据做可用而不可见,这种对权益的拆分和数据本身的归属性拆分完成的并不详细。
这种范式和标准,我想到您原来说过一个词汇,叫多元异构数据流动的标准化,如果这种范式可以嵌入标准化的流程里,就像形成一个通用语言一样,可以部署到任何的位置,通过一个简易的SDK接入,就可以实现对这种范式的部署。
PlatONCTO曲俊杰:
是的,我们的确希望通过实际商用落地逐渐把它定义清楚。
《金色深核》栏目策划人王航:
我还详细的问一下,像您刚才说的,如果一份数据,然后它是属于APP还是属于用户,还是属于平台?
这种定义有没有实现的demo,或者这种范式的基础标准。
PlatONCTO曲俊杰:
协议的实现我们正在一步步推进。
原则上,首先要保证数据隐私,例如数据可用不可见。先把数据保护起来。另外是把权益和数据结合,我们已经尝试发布了一个隐私token协议。
因为数据种类繁多,属性复杂,需要用很复杂的协议去定义,需要不停的修订以保证保证数据权益最后落地,落地在不同的国家、政体,符合不同的法律法规。这个部分挑战很大。
例如欧洲GDPR,其定义数据权益里有一条是可遗忘性,也就是说这个数据的所有方要求删除,你必须彻底干净的删除,不删除就涉及违法。
为了实现以上的需要,数据的定义协议需要有2个特点:
1.足够通用
2.具备灵活的可调整的空间
所以需要全面考虑协议框架怎么做。以身份举例,PlatON在参与W3C国际标准的did身份制定,包含身份该怎么管理、怎么授权等。
最后,还要注意,在很多领域里,还会有一些特殊的部分。
例如金融是一个难真正落地的领域,第一与钱相关,任何创新都可能造成投资者损失。第二具有高度的法律法规保护。这些会造成有些创新难度,建议法律上开辟蹊径,例如沙盒,政府规定在沙盒里可以有相当程度的创新。
不过,我们坚信在金融领域里一定会有翻天覆地的好应用,把资金的流动、风险管控、投资者保护等这些传统金融费了很大的人力、财力、时间去做的东西,非常简洁的、可靠的做出来。
PlatON网络的并行能力
《金色深核》栏目策划人王航:
那PlatON的并行计算是如何体现的呢?现在计算能力,会局限于什么?
PlatONCTO曲俊杰:
这块简单点讲是因为隐私计算有很多种。
一部分算法非常复杂,极度占用计算资源,另一部分其过程对数据的处理,需要反复多次传输、加密后再组合。
所以这几部分很适合做并行计算的处理,很早时。我们研发了一套语言,能够把安全多方计算的公式编译成门电路。
门电路的优势在于有前后逻辑关系就可以形成有向无环图DAG,实现之后,并行计算就不是问题了。
另外并行计算还体现在,为了快速验证所有默克尔树之间的逻辑关系,二叉树等结构可以拆分验证,并行计算完成后再根据密码学算法把最后两个节点合起来。但不是所有的都可以并行。
《金色深核》栏目策划人王航:
明白。我觉得可以理解为每一个计算电路,都是分片。
PlatONCTO曲俊杰:
可以这么理解,只是分场景去实现。
《金色深核》栏目策划人王航:
您刚才说的门电路是跑在什么的设备里呢?硬件给予什么样的能力呢?
PlatONCTO曲俊杰:
我们现在的硬件已经有很大的突破,比现在的市面上公开的算法提高了100倍左右,也优于微软。
这样的性能,的确是因为我们在硬件上做了一些尝试,但因为不同场景带来的密码学算法复杂度不同,其算法本身会有限制。
而数据计算时,除了GPU和带宽外,有些算法可能只适合100条数据和另一方1000条数据做协同计算。
一旦是2个G的数据和另一方10个G的数据协同计算,就完全不能商用了。
我们在做的是,最大程度的组合优化,根据不同的数据复杂度和算法复杂度、通讯复杂度,在不同的场景里不同的密码学算法接力计算,最后完成最优级的效果。
《金色深核》栏目策划人王航:
除了PlatON,我知道还有一个解决方案是PlatONE,两者在计算资源上有共享吗?
PlatONCTO曲俊杰:
我们是以PlatON为主,PlatONE的是使用PlatONDNA的联盟链。
如果PlatONE有数据,有算力或者是有好的模型想共享开放出来,可以作为可以PlatON的子链,把它的能力发布到链上,供其他人发现使用。
所以资源共享,其实是一主一辅的关系,不是单纯的共享。
PlatON架构设计的小故事
《金色深核》栏目策划人王航:
咱们刚才聊的整体看下来,我觉得是很符合工程化思维的,为了去实现数据隐私计算的工程目标,借鉴整合了多个部分,然后把它组合到一起。
例如在咱们整体的架构里面,可以看到云计算架构的设计,看到分层的设计,看到跨链,看到算力的管理和输出,那PlatON内部是怎么去推进开发过程的?从开发讨论到实施的推进流程什么样的?
PlatONCTO曲俊杰:
这个行业是比较新的,经常有新的输入,通过内部的学习讨论,可能会此前的一些方案给颠覆掉。
我们内部例如肖总、孙总,他们在战略级别会有很多洞见。
我们非常坚定的大方向是数据隐私、分布式AI。
而一直持续的修订过程会来自于PlatON的各种专家团队、技术生态委员会、生态发展委员会等。
核心团队还会与外部专家有一些定期的沟通。包括美国、新加坡、香港,日本,中国的合规应用有什么动向?密码学研究有没有新的实现,如何优化?硬件是否能优化等等。
《金色深核》栏目策划人王航:
插问您一个小问题,PlatON什么时候开始确认整个架构设计的?
PlatONCTO曲俊杰:
我们的整体架构在第一版白皮书就定义清楚了。
此前有过很深度的封闭讨论,被称作香山会议,讨论的内容例如包括要做计算的解耦,使用双层结构。
《金色深核》栏目策划人王航:
我知道PlatON有非常庞大的密码学团队,关于密码学团队的工作状态是什么样的?
PlatONCTO曲俊杰:
他们的自由度是非常高的,想研究什么都可以,只要出成果,只要能为整个社区做贡献就可以。
我们会从工程方面出命题,固定某个场景。有趣的是,有时候团队会告诉你这个做不了,但是过几天又告诉你,也许能做,可以这样做尝试。
对于某个单独的场景,一般会有多个研究方向,只要有一个方向突破了,就可以用了。
《金色深核》栏目策划人王航:
最后一个观点性的问题,外界对可编程电路的成本比较担心,那可编程电路的成本,目前来说是可控的吗?
PlatONCTO曲俊杰:
我的观点是这样,如果是指MPC相关的成本,假如在APP里实现,数据怎样进行隐私计算,电路的价值和使用频度相关。只要是使用频度高,有相当的价值体现点,成本就不是问题。
因为这些硬件还没有大规模商用,所以现在都是处于烧钱研究的状态。从我们基金会的角度来讲,暂时不考虑成本问题。
而对于商用来说,我们的确会考虑如何把这个问题做解耦,可能通过尽量做到模块化、通用化,可以实现固定成本,具体实现还有待研究。
当解耦和模块化的实现到达一定成熟程度,又有落地场景的价值覆盖成本,那个时候,成本问题只会是一时的。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。