SHA-256、MD-5…… 哈希散列函数这些原理你懂了吗?_SHA:ETF

作者:wagslane

译者:火火酱

出品:区块链大本营

本文对哈希函数进行简要的介绍,旨在帮助读者理解为什么要使用哈希函数,以及其基本工作原理。文中将省略具体证明和实现细节,而将重点放在高级原理上。

为什么要使用哈希函数

哈希函数被广泛应用于互联网的各个方面,主要用于安全存储密码、查找备份记录、快速存储和检索数据等等。例如,Qvault使用哈希散列将主密码扩展为私人加密密钥。

用途列表清单详见:?https://en.wikipedia.or/wiki/Hash_function#Uses

本文将重点介绍哈希函数的几个重要特性,也可以说是其最重要的特性:

哈希函数确定性地加扰数据;

无论输入是什么,哈希函数的输出大小始终相同;

CoinShares:上周数字资产投资产品流出总额为1.07亿美元:金色财经报道,据CoinShares报告显示,数字资产投资产品上周出现资金流出,资金流出总额达1.07亿美元。比特币流出总额达1.11亿美元,为3月份以来最大单周流出量。山寨币方面出现资金流入,Solana资金流入量最大,总计950万美元。

投资产品的每周交易量比年初至今的平均水平低36%,但在更广泛的交易所市场交易量受到的影响更大,相对于年初至今的平均水平下降了62%。从地区来看,资金流出主要集中在德国和加拿大的两家ETP提供商,分别流出了7100万美元和2900万美元。[2023/8/7 21:30:02]

无法从加扰的数据中检索原始数据;

确定性地加扰数据

首先,想象一个魔方。

Volatility Shares推出的杠杆比特币期货ETF首日交易额达550万美元:6月28日消息,Volatility Shares 推出的 2x 比特币策略 ETF 首日交易额达 550 万美元。据悉,该基金的目标是提供两倍于标普 CME 比特币期货每日滚动指数的每日表现。尽管美国存在多种比特币期货产品,但这是第一个获得美国证券交易委员会批准的杠杆产品。

此前报道,过去一周包括 WisdomTree、景顺 (Invesco) 和贝莱德 (BlackRock) 在内的公司都提交了比特币现货 ETF 申请。另据知情人士称,金融服务巨头富达(Fidelity)也准备提交现货比特币 ETF 申请。[2023/6/28 22:06:13]

我们从恢复魔方开始。如果我们随机转动魔方,到最后,魔方将会呈现和开始时完全不同的状态。同样,如果我们重新开始,重复完全相同的动作,那么我们会不断得到完全相同的结果。尽管看起来结果可能是随机产生的,但实质上并非如此。这就是“确定性”的意思。

“确定性”在安全存储密码方面起着至关重要的作用。例如,假设我的密码是“iLoveBitcoin”。

ProShares空头比特币ETF上市三天后成为美国第二大以比特币为重点的基金:6月25日消息,Arcane Research分析师Vetle Lunde表示,ProShares空头比特币策略ETF BITI上市三天后成为美国第二大以比特币为重点的基金。BITI旨在提供与比特币相反的表现,这意味着如果BTC价格下跌1%(在扣除管理费用和支出之前),基金的投资者通过持有BTC衍生品将获得1%的投资利润,它于周二在纽约证券交易所开始交易。Lunde表示,BITI在周三和周四的资金流入强劲,管理的资产相当于929BTC,超过了Valkyrie的比特币期货ETF(840BTC),以及VanEck的比特币期货ETF(830BTC)。在美国上市的最大比特币ETF是基于ProShares期货的比特币ETF (BITO),其管理资产相当于31,000BTC,按当前价格计算为6.51亿美元。[2022/6/25 1:30:32]

我可以使用哈希函数对其进行加扰:

iLoveBitcoin→“2f5sfsdfs5s1fsfsdf98ss4f84sfs6d5fs2d1fdf15”

NBA商品设计师Shawn Kurz创立基于区块链的生态系统,旨在解决全球饥荒问题:2月14日消息,NBA商品设计师Shawn Kurz宣布创立基于区块链的生态系统FoodChain Global(FCG),旨在支持针对全球饥饿问题的慈善活动。在前军事系统工程师Cody Boyd的帮助下,FCG开发团队推出了基于Polygon的FoodChain Global代币和NFT等数字资产,所得款项将用于向加拿大慈善组织每日面包食品银行和皇后大道上的避难所供应食品。(Cointelegraph)[2022/2/14 9:51:02]

现在,如果有人看到这个加扰后的版本,他们也不会知道我的原始密码!这一点非常重要,因为这意味着,作为一名网站开发人员,我只需存储用户密码的哈希散列(加扰数据),即可对其进行验证。

当用户进行注册时,我对密码进行哈希散列处理,并将其存储在数据库中。当用户登录时,我只需再次对输入的内容进行哈希散列处理,并比较两个哈希值。由于特定的输入始终会输出相同的哈希值,所以该方法每次都可以成功验证密码。

ShapeShift创始人:最终人类会转向比特币 法定货币会消失:1月29日消息,ShapeShift创始人兼首席执行官Erik Voorhees在接受采访时表示,确信随着时间的流逝,最终每个人都转向比特币,而法定货币将消失。人们使用法定货币,是因为从未遇到像比特币这样的替代品,人们总是只使用下一种法定货币。而现在既然出现了可靠的替代方案,法币将面临更大的挑战。(The Daily Hodl)[2021/1/29 14:21:26]

如果网站以纯文本格式存储密码的话,则会出现巨大的安全漏洞。如果有人入侵该网站,那么他将会能获取所有的电子邮件和密码,并可以尝试在其他网站上使用这些信息进行登录。

无论输入是什么,输出大小始终相同

如果对单个单词进行哈希,则输出将是特定的大小(对于特定的哈希函数SHA-256来说,其大小是256bits)。如果对一本书进行哈希,其输出也将是相同的大小。

这是其另一个重要特性,因为这可以节省我们的计算时间。典型的例子是在数据映射中使用哈希散列作为键。数据映射是计算机科学中用来存储数据的简单结构。

当程序在映射中存储数据时,会向映射提供键和值。当程序想要访问该值时,它可以向映射提供适当的键并接收相应的值。数据映射的优势在于它们可以立即找到数据。该键被用作计算机能够立即找到的地址,这样一来,就不必花费数小时在数百万条记录中进行搜索了。

因为键就像地址一样,不能太大。如果想将书籍存储在数据映射中,则可以对书籍的内容进行哈希散列处理,并使用哈希值作为键。作为一名程序员,我可以轻而易举地使用哈希散列来查找该书的内容,而不必按标题、作者等对数千条记录进行排序。

其工作原理是怎样的呢?

这部分是本文的难点,我会尽量将其简化,省略实际的实现细节,重点介绍计算机在使用哈希散列处理数据时工作原理的基本概念。

下面让我们来看一下我为此专门编写的一个算法——LANEHASH:

我们从要进行哈希散列的数据开始

我把字母和数字转换成1和0(计算机中的所有数据都以1和0的形式进行存储,不同的1和0的组合代表了不同的字母)

此时,我们通过各种预设的步骤对数据进行转换。步骤内容可以是任意的,但重要的是,每次使用LANEHASH时,我们都需要遵循相同的步骤,以便我们的算法具有确定性。我们将前4位从左侧移到右侧:

每隔1位进行间隔:

我们把这两部分转换为以十进制的数字。十进制是我们在学校中学过的“正常的”数字系统。(所有的二进制数据实际上都是数字,你可以在其他网站上在线查询如何将二进制转换为十进制数字)

我们将这两个数字相乘:

然后对该数进行平方:

再将该数字转换回二进制:

从右侧切掉9bits后正好得到16bits:

然后将该二进制数据转换回英语:

如上所示,如果输入相同,那么最后终将会得到相同的输出结果。但是,如果改变任何一个字母,最终的结果也将发生巨大变化。

免责声明:

在我将英语转换成二进制,并将二进制转换成英语的步骤中,并没有遵循任何模式。有许多不同的方法可以将二进制数据转换成英语并转换回去,我只是不想在本文中展开讨论这个问题。感兴趣的话,你可以通过以下链接进行了解:

https://en.wikipedia.org/wiki/ASCII

https://en.wikipedia.org/wiki/Unicode原文:https://hackernoon.com/a-very-basic-intro-to-hash-functions-sha-256-md-5-etc-21wp24jk

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金宝趣谈

[0:15ms0-7:842ms