科普 | 密码学极速入门(Part-1)_ETH:AES

作者:?LeoWhitehead

翻译&校对:?IANLIU?&阿剑

来源:以太坊爱好者

-广受欢迎的加密通讯工具——OpenSSL,其中的部分代码-

关于密码学的内在原理,一直被认为是少数专家或数学家才能涉足的领域,其中的技术细节在大多数人看来就像变魔术一样。考虑到现代密码学的复杂程度,我们可以理解为什么很多人对密码学存在这些误解;但不了解密码学,可能会做出很多弊大于利的决定,比如英国的加密禁令提案,澳大利亚的援助和访问法案等。

在本篇指南中,我们会帮助大家掌握学习密码学所需的入门知识、对不同密码学体系的发展历程进行简介,并对当前三个最流行的密码学领域——流密码、分组密码、公钥密码,进行快速上手指导。

密码

“密码”指的是对消息进行加密或解密的算法,也是密码学的基石。加密算法(E)使用密钥(k)对消息(m)进行加密,并生成密文(c);类似地,解密算法(D)使用密钥(k),对密文(c)进行解密。如下列所示:

-加密算法'E'及解密算法'D'-

上述过程也意味着,一种算法要想被称为“密码”,还必须满足以下的一致性方程特性,确保密文可以被解密。

式子表明着如果你使用密钥?K?对消息进行加密,也能使用密钥?K?对密文进行解密,并得到与原来消息一摸一样的输出。

Web3运动鞋转售平台MetaZ完成100万美元融资:5月9日消息,美国Web3运动鞋转售平台MetaZ Holding宣布完成100万美元融资,Pinewood Capital参投。MetaZ的韩国子公司MetaZ.inc目前运营着一个基于NFT的运动鞋交易市场Meta[Z],NFT拥有者能够交易基于NFT的可收藏运动鞋。[2023/5/9 14:52:55]

其中一种最古老、最简单的密码就是凯撒密码——直接从字母表中选取特定位置,替换掉原消息中的字符。

-凯撒密码出现于公元50年,凯撒大帝使用字母表跳三位的字来替换原来的消息内容,用于军事通讯-

下面的例子就是经过后三位字符替换过后的密文形式:

凯撒密码可以用下列式子表示:

虽然这种做法符合我们对密码的定义,但是它非常不安全。只要攻击者知道密文是以这种方式加密,就能通过尝试另外25种组合进行破译;即使攻击者不知道密文使用了凯撒密码,他们也能够观察到密文中的规律进行破译。

虽然这种做法符合我们对密码的定义,但是它非常不安全。只要攻击者知道密文是以这种方式加密,就能通过尝试另外25种组合进行破译;即使攻击者不知道密文使用了凯撒密码,他们也能够观察到密文中的规律进行破译。

在进一步介绍更安全的加密算法之前,我们得先聊聊什么是Xor运算。

XOR

比特币全网未确认交易数量为30511笔:金色财经报道,据BTC.com数据显示,目前比特币全网未确认交易数量为30511笔,全网算力为353.36 EH/s,24小时交易速率为3.60交易/s,目前全网难度为46.84 T,预测下次难度上调0.26%至46.96 T,距离调整还剩8天15小时。[2023/3/29 13:31:47]

Xor运算,又称为“异或门”,是一种布尔变量逻辑判断,能接收1或0作为输入:如果输出1则表示两个输入不同;输出0则表示两个输入相同。下图的真值表列出了经过异或运算后,所有可能的输入输出组合:

异或运算也经常用符号⊕来表示:

0⊕0=0

0⊕1=1

1⊕0=1

1⊕1=0

关于异或逻辑,以下有几点重要的特性:

异或运算结合律:a⊕(b⊕c)=(a⊕b)⊕c

对自身进行异或运算结果为0:a⊕a=0

对0求异或,结果为自身:a⊕0=a

根据上述异或运算的规则,我们知道a⊕b⊕a等同于a⊕a⊕b,也等于0⊕b,运算结果为b。要注意的是,这些异或运算特性只适用在1和0,因此对不同进制的数字进行异或运算之前,需要先将其转换为二进制。例如:

87⊕73=1010111b⊕1001001b=0011110b=30

接着,我们可以开始介绍第一种安全密码了。

一次性密码

FrankMiller在1882年提出了一次性密码的概念——加密:将消息和私钥进行异或运算得到密文;解密:将密钥和密文进行异或运算得到原消息,这个过程类似于前面提到的a⊕b⊕a=b。一次性密码的定义如下所示:

哈萨克斯坦限制加密挖矿用电的法律生效:金色财经报道,一项扩大加密货币矿工监管框架、同时限制他们获得低成本电力的新法律已在哈萨克斯坦生效。这项立法引入了挖矿许可证制度,有两类不同的许可证,公司必须定期更新。据当地媒体报道,这些变化还旨在为加密行业的发展和市场参与者之间的公平竞争创造条件。(金十)[2023/2/11 12:00:28]

该密码的一致性方程也很容易证明:

一次性密码非常容易上手,假设我们要加密一串字段“Message”,首先可以通过ASCII字符集将“Message”转换为二进制数据。

现在,我们需要一组56位随机二进制数来对明文进行异或运算,该私钥随机程度越高越好!

-从random.org生成的随机数-

我们将明文和私钥的每一位进行异或运算。

运算后的结果就是我们的密文了!要解开密文也很简单,我们只需要将密文和刚才生成的私钥进行异或运算,并转码回ASCII,就能得到原消息。

人民数字FINTECH推出区块链科普动画:人民日报数字传播发布微博称,人民数字FINTECH出品《趣味科普|区块链动画》。[2020/3/31]

这种密码简单易用,而且还有个很有意思的特点。一次性密码具有所谓的完全保密性,这意味着从数学角度来说,攻击者不可能从密文推得任何原消息的内容,当然也不可能破译。

既然我们已经有了简单易用,且不可能破译的密码,为什么我们还会想用其他的密码呢?根本原因在于,一次性密码虽然很有效,但是他有一些重大的缺陷。

第一个缺陷是,不论我们想要加密什么样的消息,都需要有和原消息一样长或是更长的私钥用于加解密。而且为了让密文接收者能够解密密文,需要有绝对安全的通信方法把私钥给到接收者;这就形成一个悖论,如果有这种安全通道,那不如直接把原消息发过去得了。

第二个缺陷可以从“一次性密码”的名称中发现。针对不同消息,同一个私钥每回只能使用一次;如果对多个消息重复使用同一个私钥,其引发的问题可以从数学推导上看出。

假设我们有两条消息m1和m2,分别使用相同的私钥k进行加密。通过异或运算,我们会得到以下密文:

从上图,我们可以从密文C1⊕C2得到m1⊕m2。对于攻击者来说,他们就能基于这种关联性,通过各种统计分析、频率分析、模式匹配,或是使用2006年提出的自然语言处理方法,来获得原消息的内容。我不会深入解释存在这种关联性具体造成的危害,这里只是形象的说明当同一个私钥被使用的次数越多,密码的安全性就越低。

现在我们已经具备XOR加密和一次性密码的基础知识,是时候了解其他更实用的加密方法了。

流密码

一次性密码具有非常好的安全性,这意味着手上只有密文的情况下,攻击者不可能进行破译。但是好的安全性基于长度大于等于原消息的私钥,这使得一次性密码并不实用,因为如果加解密双方有很好的方法来传递消息和私钥,他们直接传递消息就好,没必要进行加密。

财政部副部长朱光耀:数字经济还处在发展的过程中,要以科普、推动的态度来推进数字经济发展:今日,在中国发展高层论坛2018年会上,财政部副部长朱光耀表示:“数字经济还处在发展的过程中,要以科普、推动的态度来推进数字经济发展。也要关注数字经济的其他影响,包括税收征管、反监管措施等要跟上。”[2018/3/25]

为了让一次性密码更加实用,我们引入“流密码”的概念。流密码的核心思想是——以“伪随机”密钥替代一次性密码中的“随机”密钥,伪随机密钥产生自

密码学安全伪随机数生成器。要注意的是,CSPRNG不同于一般的伪随机数生成器,因为CSPRNG产生的数据必须和真实随机数看起来没有区别才行。CSPRNG是一种算法,能产生一长串数字,类似于随机数的性质。因为随机数很难生成,所以CSPRNG要依靠种子来决定初始状态及将来产生的数;CSPRNG从相对较小的起始种子生成海量的随机数。如果起始种子是已知的,则随后产生的所有数都是已知的,也就是说CSPRNG具有确定性;这也导致CSPRNG产生的数,其随机程度完全取决于种子的随机程度。为了让一次性密码更加实用,我们可以根据所需长度,使用伪随机数生成器的输出替换原来的私钥;这样的话只要传递初始种子就可以了。因为CPRNG具有确定性,使用相同种子能得到相同输出。

为了更好理解,我们先看看原来的一次性密码:

使用伪随机数生成器的输出G(K),替换原来的私钥K:

替换后的私钥可以远远短于要加密的消息,使得分配及管理私钥更为方便,进一步改善了一次性密码不实用的问题。但这种做法也带来了新的问题:

将原来完全随机的私钥替换为安全随机数生成器的输出,会导致私钥长度比原消息短,使得我们的密码不再具有完全保密性。因此流密码的安全性取决于我们的伪随机数生成器的不可预测性。如果可以预测CSPRNG的输出,则可以获得明文消息。以下是大家熟知的一些使用弱流密码的密码系统:

802.11bWEP:WEP是一种给WiFi数据做加密的算法,它使用的流密码称为RC4。因为流密码中不能一直使用同个密钥,所以长期使用的密钥包含一个每次都会变动的值“IV”;然而“IV”只有24位,也就是说加密超过5000条消息后,就会有五成的概率出现相同的密钥。

CSS:DVDForum使用内容扰乱系统来管理DVD的数字版权,使得仅有获得授权的应用才能访问DVD内容。CSS使用40位的密钥,而40位的密钥空间较小,可以相对快速地暴力破解。

现在我们也掌握了流密码的知识,可以进一步讨论下一个密码系统——分组密码。

分组密码

分组密码是另一种能用于加解密数据的方法。分组密码包含两种算法:E用于加密,D用于解密,同时也用到了密钥K。

分组密码的核心在于,要加密的明文和输出的密文长度始终相同,为一固定量。该固定量称为“blocksize”,大小取决于所使用的分组密码算法。另外,私钥K的长度被称为密钥大小,也是固定量。常见的两种分组密码分别是3DES及AES——3DES具有64位的消息大小和168位的密钥;AES具有128位的消息大小和128、192或256位的密钥。

因为分组密码把可能的区块映射到其他的每一个区块,所以也被称为“用密钥完成的置换”或是“伪随机置换”。非常重要的一点是,私钥决定了输入的区块和相关密文区块的映射关系,而且是一对一排列的,所以只要知道私钥就能解密密文。

第一个比较重要的分组密码是1970年代IBM开发的数据加密标准,但DES并不安全,很快就被3DES取代;紧接着3DES又被1997年开发的高级加密标准所取代。AES是在国家标准与技术研究所的要求下制定的标准化分组密码。AES是当今使用的最常见的分组密码,重要性大大超过DES和3DES,所以我将着重介绍AES。

在我解释AES到底是怎么运作之前,先提醒一下我会跳过很多技术细节,如果有人对这深入这方面领域有兴趣,可以从这里获得你想要的。

AES及大部分分组密码,都是通过迭代进行运作的,输入的文本消息会使用连续的密钥以迭代的方式进行加密。第一步是获得一个密钥K,密钥一般是128位、192位或256位的,在这里我们只演示128位的AES;然后拿该密钥推导出一系列的RoundKeys来加密我们的消息。

上图例子中,我们输入128位的密钥,并通过Rijndael密钥方法?将密钥扩展成11个16字节的子密钥。接着,AES将原消息放入轮次函数?R(kn?,m)?进行独立加密计算,每次计算把扩展出来的轮次密钥?kn?及消息状态?m?作为输入,总共进行10次。

因为AES只能用在128位的消息上,因此我们把输入的消息?m?表示成4x4矩阵的单字节单元,同时也能把轮次密钥表示成4x4的矩阵,这样就可以对消息及其中间状态进行异或运算了。

首先,输入的消息和第一个轮次密钥进行XOR,再通过字节替代、行位移、列混淆等运算,输出转变后的消息状态作为结果。接着我们使用不同的轮次密钥重复上述这些步骤10次,唯一的不同点在于最后一次的计算不包含列混淆。最终的消息状态和第十一个轮次密钥进行异或计算,得到最后的输出。下面简述了每一轮次的计算中包含的三种步骤:

字节替代:根据替换表,将消息状态矩阵中的每一个字节,替换为相应的字节。

-在AES使用的替换表中,每一个字节单元以16进制表示。如,字节9a会替换为b8-

行位移:定量移动每一行。第一行不移动,第二行左移一位,第三行左移两位,第四行左移三位。

列混淆:对消息状态中每一列进行线性变换。目前为止,我们已经能使用AES来加密数据。然而,你可能很快能发现AES的局限性——没办法在只用一次AES的情况下,对超过128位的消息进行加密。要对超过16字节的消息进行加密,我们需要引入模式加密概念。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金宝趣谈

[0:0ms0-6:440ms