隐私计算是当下数据安全领域的热门赛道,无数企业纷纷涌入,抢跑占道。
相对国外而言,我国企业布局起步较晚,但整体发展迅速。
2016年,我国开始出现垂直的隐私计算厂商,近年来,随着行业客户在应用层实践的逐步加深,除了垂直的隐私计算厂商外,各类技术企业纷纷入局,数据运营、算力加速等需求正在不断涌现。
百舸争流、千帆竞发的市场格局初显。
就目前发展现状看来,政策与技术正在共同促进隐私计算发展。据Gartner报告预测,到2024年,由隐私计算驱动的数据保护和合规技术支出将在全球突破150亿美元以上,即达到千亿人民币以上。
「论道隐私计算」作为一家专注于区块链隐私计算赛道入门科普的垂直媒体,同时也是针对隐私计算兴趣者开放的纯天然、低门槛入口,我们通过研读隐私计算行业报告,汇总并分类了隐私计算行业内晦涩难懂的名词,编写了「隐私计算词典百科」板块,将以最简单的语句结合举例说明,让大家对于隐私计算的行业“黑话”快速上手。
此篇,我们围绕“数据”一词进行展开——“数据”是否等同于信息?人们经常挂在嘴边的“大数据”是什么?“数据交易所”里交易的又是什么?以下请Enjoy。
数据与大数据
数据是事实的体现,也是通过观察、实验和计算所得出的结果,用以表示客观事物的未加工的原始素材。数字、文字、图像以及声音等都可以是数据的表现形式。
隐私计算网络Phala Network已完成双子星经济模型升级:4月8日消息,隐私计算网络Phala Network已完成双子星经济模型升级,目前出块稳定。
据悉,双子星经济模型升级后,合并了Khala和Phala的挖矿奖励,本次升级非强制升级,在用户到达目标区块后,新经济模型将自动生效。[2022/4/8 14:13:15]
随着云技术、分布式计算和存储等技术的发展,目前我们已经步入了大数据时代。近几年来所产生的数据量之和相当于我们人类发展历史上所有的数据量之和,据国际机构IDC预测,数据每年都在以50%速度在增长。
数据正在快速的增长,而大量的数据已经无法通过人工在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。
因此,大数据可以简单理解为大量的数据,除了大量化,大数据还具有多样化、快速化、价值密度低的特性。大量的、不同来源、不同形式的数据通过现有的技术进行整合、分析,成为了互联网发展的重要生产要素。
数据要素
当前,数字经济已经成为了全球经济发展的重要推动力,快速增长的数据量逐渐实现了量变到质变的转换,产生了全新的价值。
2020年4月9日,中共中央、国务院发布《国务院关于构建更加完善的要素市场化配置体制机制的意见》,其中明确提出了土地、劳动力、资本、技术、数据这五个生产要素。
隐私计算网络Oasis携手DappRadar推出50万美元生态加速器计划:2月4日消息,隐私计算网络Oasis与Dapp市场数据和分发平台DappRadar建立合作关系,双方将携手推出500,000美元生态加速器计划,参与该计划并脱颖而出的10个优质项目团队,将可各获得50,000美元的奖金以及技术、营销等方面的支持,以帮助项目成功启动和加速运作。[2022/2/4 9:31:36]
简单来说,数据要素已经成为了数字经济下的新型生产要素,能够作为生产力并产生经济效益,这也意味着,数据将对经济的总体发展起到关键作用。因此数据要素既是来自个人衣食住行、医疗、社交等行为活动,也是来自平台公司、政府和商业机构提供服务后的统计与收集。
数据要素市场
在数据成为和土地、劳动力、资本、技术并列的五大生产要素之一后,加快培育数据要素市场成为了数字经济发展的下一步目标。通过数据要素在交换或流通中形成市场,让数据要素价格由市场定、流动随需求走,配置高效公平,促进数据要素高效合规流通使用。
数据作为互联网时代的重要资产,也是推动数字化发展的最佳手段,然而只有对其进行分析、流通以及确权等操作后才能更好的量化,数据要素释放出有效的价值,为市场提供新的动力。
数据产权
产权的产生,实际上是一个成本收益权衡的过程。
隐私计算AI网络PlatON宣布正式启动安全多方计算仪式Lumino:6月7号消息,隐私计算AI网络PlatON宣布正式启动安全多方计算仪式Lumino,参与者们能以分布式的方式参与PlatON生态网络。Lumino仪式分为两个计算组,针对底层不同的密码学配置,参与者可以选择加入其中一个,或者两个计算组都参加。计算过程将依次执行。一旦仪式启动,参与者运行开源的客户端软件,并在几个小时内完成计算,参与者可以在仪式开启后的任意时间加入。根据参与者设备和带宽的具体情况,此次计算通常需要1到10小时左右来运行客户端软件。另外,系统为每个参与者运行过程配置15小时的窗口,以鼓励参与者及时完成工作量。组织方将为每一位运行客户端软件的参与者采用一个可验证计算范式。[2021/6/7 23:18:18]
而在数字经济时代下,数据产权可定义为:数据主体对基于数据处理行为而产生的数据所享有的权益,包括数据的所有权、占有权、使用权、收益权、处置权等。
不同于资产产权具有的唯一性和排他性,数据产权因数据的可复制性或而不具有排他性,因此数据产权的利益主体不限定为自然人,还包括法人、非法人组织、政府或国家。同时,数据产权界定是数据要素有效配置的基础,对激活数据要素市场、促进数字经济发展具有重要的意义。
数据失真
数据失真是指原始真实数据经过计算机或者人为原因的改变,造成数据结果与真实数据发生偏差的现象。
波卡生态身份协议Litentry与隐私计算协议ARPA合作提高去中心化数据安全性:波卡生态身份协议Litentry宣布与隐私计算协议ARPA达成合作,双方团队将密切合作,探索在不暴露用户数据的情况下匹配目标用户,并利用ARPA的MPC(安全多方计算)技术以保护隐私的方式分析用户链上和链下数据。此外,双方还将在更高层面上合作,以为去中心化身份和MPC标准做出贡献。[2021/4/13 20:14:18]
数据失真的背后有技术原因,比如数据统计方法不科学、数据采集标准不合理等;同样也不排除人为造假的因素。在生活中最常见的是统计数据失真,数据失真将会带来巨大的损失和影响,随着社会经济发展越来越依赖数据,因此防止数据失真将成为数据经济发展的重要议题。
数据密态
2022年,数据领域将告别数据明文,即将进入“数据密态”的新时代。
数据与其他资产明显不同的是,很容易被拷贝复制。数据流通对于产业信息化进程、数字化转型是必不可少的,但明文数据流通又有显著危害。
面对数据要素发展和数据安全保护的双诉求,数据密态无疑是当前最好的选择。一方面,运营者要想“确保其收集的个人信息安全”,最简单有效的就是保证其数据明文不被其他方获得;另一方面,如果要保持数据价值,匿名化后的数据也需要进行密态化处理。
数据挖掘
在信息化时代下,很多领域每天通常需要处理数以万计的数据交易,这是一种庞大的信息数据处理工程,而怎样在如此庞大数据当中筛选,并且提取及分类真正有价值的数据,成为了主要问题。
谢翔博士:区块链和隐私计算既相对独立又必须联系在一起:在“对话首席”视频直播活动中,区块链技术是否天生适合隐私计算的问题,PlatON的算法科学家谢翔博士表示:区块链共识的本质是所有数据完全备份,并向所有人公开,从一开始就不具有隐私保护的功能。当然,区块链为我们提供好的东西,有可能提供分布式基础设施,实现支付功能。
因此,区块链和隐私计算是相对独立的,但又必须联系在一起。简单来说,隐私计算在上层和业务联系,能够保护数据的隐私;区块链在下层作为分布式经济体基础设施,提供支付和结算的功能。[2020/3/26]
而数据挖掘技术则很好地解决了此类问题,因此数据挖掘对于大数据时代而言具有重要的意义。
数据挖掘又常被称为数据库中的知识发现。主要特点是对海量数据进行抽取、转换以及分析等处理,并从中归纳出有建设性的模式或规律辅助决策,其主要经过数据清洗、数据集成、数据转换、数据挖掘、模式评估和知识表示六个步骤。
数据清洗
数据清洗指对数据进行重审和校验的过程,目的在于删除重复信息、纠正存在的错误,提供数据的一致性。
数据清洗顾名思义就是“洗掉脏东西”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。
数据清洗技术是提高数据质量的有效方法。数据清洗主要应用于3个领域,即数据仓库领域、数据挖掘领域以及数据质量管理领域。
数据聚类
聚类分析的目的是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。
目的是,组内的对象相互之间是相关的,而不同组中的对象是不相关的。组内相关性越大,组间差距越大,说明聚类效果越好。
数据聚类是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,生物信息和图像分析。
数据群岛
谈论数据群岛之前,我们先了解一下数据孤岛。
从数据应用伊始,“数据孤岛”问题一直阻碍着数据运用效能的进一步提升。因此在构想教育数据蓝图的同时,首先需要破除数据的“门户之见”。
何谓数据孤岛?数据孤岛是指不同的数据掌握在不同的政府部门或企业手中,而每个数据系统均各成体系,以各自不同的方式存储在不同的服务器上,导致在功能上互不关联,在信息上互不交换的处境。
因此想破除数据孤岛就需要在数据层面进行集成,建立一个庞大的、完整的、连通的数据仓库。一套完整的数据仓库包含模型语言、优化的数据结构、查询语言及撰写报表的程序以及交易机制。
数据群岛旨在形成数据间关系网,在打破数据孤岛的同时,也形成了独立的数据生态。
数据分类分级
一组数据在遭到篡改、破坏、泄露或者非法使用后必然会对数据拥有者造成不同程度影响,因此可以根据由轻到重的不同影响将数据分为不同级别,方便数据管理时进行不同等级的区别管理。
数据分级本质上是根据数据敏感程度进行分类,因此,我们在数据安全治理或数据资产管理领域,都是将数据的分类和分级放在一起做,统称为数据分类分级。
数据可视化
数据可视化是利用计算机图形学和图像处理技术,将枯燥乏味的数据图形化,以达成清晰有效传达与沟通信息的目的,并进行延伸的交互处理理论、方法和技术。
数据可视化的基本思想是将数据库中的单一数据作为单个图形元素,大量数据集则可以构成数据图像,同时将数据的各个属性以多为数据形式表示,从而能对数据进行更深入的观察与分析。
但数据可视化并不意味着要让图形看上去绚丽多彩而显得华而不实,只要能直观有效地传达信息即可。而如何平衡设计与功能,设计出更直观的数据可视化图形则是另一门学问。例如,目前正在飞速发展的VR技术就是以数据可视化为解决方案的。
数据资产化
属于个人或企业的数字化财产被称为数据资产。
例如,人们日常拍摄的照片、视频,编辑的聊天文字,购物消费产生的信息等都属于人们的个人数据资产。
而对于企业拥有或控制、并且预计将为企业带来经济利益的数据资源,例如设计图纸、合同订单、以及任何涉及到使用文件作为载体的各类业务,都属于企业的数据资产。但需要注意的是,一般来说,企业的数据资产包含有实物纸质文件和电子文件,但数据资产是以数字化形式存在,因此需要将纸质文件转化为数字化形式,才能真正地形成企业的数据资产。
一般来说,数据资产化的范围只包含企业数据资产,通过将其拥有的数据转化为可以交易的资产,例如房产、股票等,这样的过程则称为数据资产化。
数据交易
数据交易近似于“买卖行为”,主要是指数据拥有者和数据使用者达成协议,进行合规的数据资产自由交易。
大数据环境下,企业可以接触到的数据大致可分为用户个人的信息数据、企业采集的数据集合和衍生数据三大类。但目前各大数据交易所交易的对象主要是商业市场数据,都暂未涉及个人信息相关数据。
而对于商业市场数据,也可分为两类数据交易产品:一类是数据集市型交易,主要交易粗加工的企业原始数据,很多交易所或交易中心在发展初期都是以这种交易模式为基本发展思路。
另一类是数据加工服务型交易,数据交易双方不直接交易原始数据,而是将其拥有的数据资源通过特定逻辑和算法进行分类整合、深度加工、匿名处理等处理,通过自己开放数据平台等模式提供数据产品或数据服务,而这一类也是更加成熟的交易形式。
数据交易所
数据交易所形成了一个数商体系,包含有数据交易主体、数据合规咨询、质量评估、资产评估、交付等多领域,并且会设立数据交易制度。
在这里,数据可以进行确权,进行数据价格发现与定价,有明确的监管和规则,给数商入场,给交易方建立互信。它还提供有线上数字化数据交易系统,保障数据交易全时挂牌、全域交易、全程可溯。
目前,各地数据交易所交易的标的不是原始数据,而是通过清洗、分析、建模、可视化等方式对原始数据经过深度分析处理、整合加工而形成的数据产品和服务。
简而言之,数据交易机构不是简单地将买方和卖方进行撮合,而是根据不同用户需求,围绕大数据基础资源进行清洗、分析、建模、可视化等操作,形成定制化的数据产品,然后再提供给需求方。
来源:金色财经
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。