金色观察 | 以太坊ProgPoW升级再度无望?一文读懂ProgPoW

原本计划要在伊斯坦布尔硬分叉中实施的ProgPow终于又有消息了,但是什么时候升级仍然悬而未决。

据CryptoBriefing报道,以太坊核心开发者正在推进ProgPoW,暂定在7月进行硬分叉升级。自从矿机制造商比特大路和芯动科技分别于2018年4月和7月发布专用集成电路(ASIC)的以太坊ASIC矿机E3和A10以来,为避免专业ASIC矿机制造商垄断以太坊算力,保护以太坊网络的去中心化和网络安全,以太坊社区在过去两年中一直在讨论将以太坊算法转换为ProgPoW的问题。新算法可以使以太坊挖矿具有抗ASIC性。

但是,最新消息是,硬分叉协调员James Hancock谈到ProgPoW是否应该跟 EIP-1962放到同一次分叉中,但是以太坊社区核心人员如Spankchain的Ameen Soleimani、Gnosis的MartinK?ppelmann、Uniswap的Hayden Adams、ConsenSys的Igor Lilic以及众多以太坊开发人员表示反对ProgPoW。也就是说,以太坊核心开发者并未就ProgPoW达成一致意见,也没有暂定硬分叉的时间。

那么ProgPoW到底是个啥?ProgPoW何以能缩小GPU挖矿与ASIC之间的差距?

ProgPoW主要是根据GPU的特性对以太坊的Ethash算法做了修改,缩小GPU与专用ASIC之间的算力差距。

一句话解释,用ProgPoW开发团队IfDefElse的话是:“PoW挖矿,通常是设计硬件让算法更高效。但ProgPoW相反,先有硬件,然后再修改算法来匹配它。”

挖矿软件T-Rex已通过双挖形式破解英伟达LHR显卡算力:10月8日消息,挖矿软件T-Rex宣布,已通过双挖形式破解英伟达LHR显卡算力。据T-Rex介绍,包括3060、3070Ti、3080、3080Ti在内的LHR显卡都可进行双挖。目前双挖token的方式主要为使用30%的算力挖ETH,剩余70%的算力挖ERGO、RVN或CFX。值得注意的是,参与双挖的显卡显存需至少8GB。[2021/10/8 20:13:32]

Ethash算法

PoW是一个概念统称,有很多种算法实现。目前以太坊使用的具体PoW算法是Ethash,它是Dagger—Hashimoto算法的变种。

Hashimoto算法采用IO饱和策略来对抗ASIC,使内存读取成为PoW挖矿过程中的限制因素。Dagger算法使用DAG(directed acyclic graphs—有向无环图)来同时实现内存难解和内存易验证两个特点。主要原理是挖矿过程需要存储完整的DAG数据,同时在计算每个nonce时需要抽取DAG中的部分数据。

选取这个算法的结果使得,挖矿计算性能的瓶颈在于内存大小和内存带宽,而和哈希计算能力关系不大。比如NVIDIA GTX1070执行Ethash时,内存在达到88.3%的利用时,作为显卡计算核心的SM(streaming multiprocessor)只有27.7%的利用率。

同时使得通过大规模部署共享内存的ASIC矿机并不能带来在挖矿效率上同比例线性增长。

LTC突破150美元关口 日内涨幅为5.48%:火币全球站数据显示,LTC短线上涨,突破150美元关口,现报150.04美元,日内涨幅达到5.48%,行情波动较大,请做好风险控制。[2021/1/18 16:28:06]

Ethash算法的一般流程如下:

1、首先根据块信息计算一个种子;

2、使用这个种子,计算出一个16MB的cache数据。

3、通过cache,计算出一个1GB(初始大小)的数据集(DAG),DAG可以理解为是一个完整的搜索空间,全客户端和矿工需要存储完整的DAG,

4、挖矿:需要从DAG中重复随机抽取64次数据拿去和其他数据计算mixhash(如下图)

在早期Ethereum和Solidity智能合约代码中,Keccak和SHA3是同义词。在2015年8月NIST标准化SHA3后,标准的SHA3和Keccak算法有所区别。为了避免和NIST标准的SHA3混淆,现在的代码直接使用Keccak作为函数名。

每次Ethash从DAG中随机取64128 bit=8192 Bytes数据。以GTX 1070显卡为例,带宽为256GB/s,那么每秒能承受256*1024*1024*1024/8192=33554432次Ethash运算,即33MH/s算力。

针对Ethash的专用ASIC

可以根据需要执行的命令量身定制专用硬件来解决,比如在Ethash开始和结束时调用的哈希函数Keccak在ASIC上可以更有效执行。

针对Ethash,专用ASIC大致可以采用三个专用功能来提高计算性能:

一个从DAG导入数据的高带宽内存接口(一般来说是GDDR6或者HBM2)

一个用于Keccak哈希计算的keccak引擎;

一个用于执行内部循环FNV和地址模运算的小型计算核心;

由此专门定制的ASIC将比现有GPU体积更小且能耗更低。高配置(GDDR6或者HBM2)的以太坊ASIC矿机可以达到GPU矿机挖矿性能的2倍。

事实上,大矿机商都曾推出过以太坊ASIC矿机。2018年4月比特大陆推出以太坊ASIC矿机E3,芯动科技2018年7月发布以太坊ASIC矿机A10。但因为以太坊社区抵制,威胁可能会修改算法,同时还有部分技术原因,比如比特大陆的E3因为采用的是DDR3内存,ASIC矿机相比GPU并没有多少算力优势。因此,以太坊ASIC矿机并没有得到大规模采用。

ProgPoW做了哪些改变

ProgPoW,是Programmatic Proof-of-Work的缩写。正如IfDefElse所说,为匹配现行主流GPU的硬件特征,ProgPoW算法主要做了如下改进:

1、把keccak_f1600(64字节的字)改成keccak_f800(32字节的字)。32字节是目前主流GPU一次操作处理的实际位数。

2、在主循环环节增加了数学随机序列。目前GPU计算核心内有着大量暂存器,可为高吞吐量可编程数学单元提供信号。Ethash的内部循环先是DAG载入,然后用FNV将数据合并为小的混合状态。ProgPoW添加了一系列随机数学指令和随机缓存读取,进而合并为更大的混合状态。

3、DAG数据读取大小从128 byte增加到256 byte。当前主流GPU DRAM均为32位(32*8=256 byte),这样ProgPoW可以在当前DRAM设备上更有效率地执行;

4、GPU具有少量高速暂存器内存,允许快速处理访问随机地址,ProgPoW也利用了GPU这一特性。

其中迭代运算次数即访问DAG次数保持不变,与Ethash一样仍是64次。

经过优化后,ProgPoW能大幅提高GPU计算能力。Nvidia GTX1070运行ProgPoW测试结果表明,在内存利用率达到87.55%时,GPU计算核心的SM(streaming multiprocessor)利用率能达到87.95%。

ProgPoW大幅缩小了ASIC和GPU间的性能差距

理论上,还是可以制造出专门用于执行ProgPoW的ASIC的。但这种ASIC不仅需要高带宽内存接口和小型Keccak+KISS99引擎;还需要具有大型寄存器、大量随机数学能力的计算核心;高吞吐量、低延迟、大存储的缓存。

造成的实际后果是这种专用ASIC会和与现有GPU的性能非常相似。经过优化后的ASIC计算性能将只有目前GPU的1.1-1.2倍,大幅缩小ASIC和GPU之间的性能差距。

考虑到研发ASIC的巨额成本以及以太坊社区的抵制,研发以太坊ASIC极低的性价比也会让矿机商主动远离以太坊。

事实上,要不要抵制ASIC本身也存在争议。因为在有些人眼里,GPU也是某种形式的ASIC。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金宝趣谈

XLM如果将2100万枚比特币分配到全球 我们能获得多少?

比特币是那里最稀有的资产之一,这不是秘密,但是您是否想知道最大的加密货币到底有多稀有? 比特币的增值空间还很大 想象一下,如果有一个新的全球机构冒出来,通过一个类似联合国的机构监管世界,并决定每个人都应该生而平等。更重要的是,这个新机构将认可比特币为合法货币,并将其分发给所有人。

AVAX金色百科 | OKEx遭遇的DDos攻击是什么?影响有多大?

2月28日凌晨,加密货币交易所OKEx CEO Jay Hao发布微博OKEx遭遇DDoS攻击,已分钟级完成抗D流量切换,另外对于这种大规模的DDoS攻击,报警处理。 2月28日下午2:30起,OKEx再次遭受多轮DDOS攻击,单次最高流量峰值甚至达到400G,截至发稿前攻击依然在持续。

XRP分析报告盘点各大主流币的最新筹码分布

Coin Metrics最新报告对比特币、以太坊、莱特币等主流币的持币地址进行了分析,给出了最近的筹码分布图谱。 比特币最初由几个人持有,随着时间的流逝,逐渐分配到数百万个不同的地址。 比特币巨鲸地址(持币量至少占总供应量的千分之一)的持币量占总供应量的比例在2011年2月达到了33%的历史峰值,截至今年2月,这一数字已降至11%。

Bitcoin历史性投票后 EOS网络通货膨胀率大幅下降

EOS社区最近提出并批准了对协议的更改,该提案可显著降低网络的通货膨胀率。 2月25日,EOS Nation发起多签提案setinflation,提议将EOS总通胀率设置为1%,且不再注入eosio.saving账户。经测试,该提案参数更改在Jungle测试网上是有效的。最新数据显示,该提案已获15位出块节点投票通过。

[0:15ms0-10:995ms