观点 | 如何看待 Infura 服务崩溃及其造成的影响?_ETH:Ethereum Name Service

事件经过

北京时间2020年11月11日下午,以太坊社区知名的节点服务Infura被曝出API服务出错,并因此导致了多个依赖于Infura来构建的服务的崩溃,或者前端显示不正确。

就Infura自身而言,可以把它理解为一个公开的以太坊节点,这个节点会接收请求并返回一定的服务,比如帮忙转发交易、比如检查某笔交易上链了没有,又或者某个账户的状态如何。实际上,只要自己部署一个以太坊节点,就能提供跟Infura同样的服务。但它的特殊性在于,Infura的大部分服务都是免费的,因此很多服务都选择了依赖Infura来向自身播报以太坊区块链的状态,免去了自己部署节点的麻烦。

也正因此,Infura出错,理论上波及面会很广,在事件发散的过程中,甚至还有人扬言“以太坊会分叉”。理由是两个不同的区块浏览器上,对同一个块高显示了两个不同的区块。

但很显然,以太坊根本没有分叉。从事实上来说,两个区块浏览器所显示的后续区块都是相同的,这表示出块的矿工没有以两个不同的区块为父块来继续挖矿,也没有彼此拒绝对方的区块。从理论上来说,只有出块的节点彼此之间使用了不同的共识规则,且都占据了一定的算力,才有可能形成分叉。

观点:BTC到2030年价值将达到150万美元:金色财经报道,ARK Invest首席执行官Cathie Wood表示,她和她的基金现在对BTC的“牛市”更有信心,到2030年价值将达到150万美元。

Cathie Wood表示,随着地区银行破产,股票全面暴跌,比特币从19,000美元上涨至30,000美元。这次反弹标志着投资者“逃向安全”,这是每个人最终都希望的,比特币既能防止财富被直接没收,也能防止财富被间接没收。直接没收是指用武力窃取个人财产,而间接没收则是指通货膨胀,尤其是通过增发货币使货币供应量膨胀到天文数字。比特币的供应量在程序上被限制在2100万个单位,因此不可能出现这种形式的通货膨胀。然而,即使在法币通货紧缩的环境下,比特币也能对冲交易对手的风险。比特币不会出现08、09年的情况。[2023/7/19 11:03:48]

事实上,人们很快就发现了,这是因为Infura没有运行最新版本的Geth客户端,而某些特殊的交易触发了这个版本的客户端的bug,使之宕机了。Blockchair也是同理。所以很快就有人出来呼吁大家尽快升级Geth客户端。

观点:资金量、交易所存量、流通量是当前三个反应市场涨跌和情绪的有力指标:金色财经消息,据分析师Phyrex发文表示,相对于各种刻舟求剑的数据面或技术面来说,目前其个人认为就三个数据是唯一能反应出市场涨跌和情绪的。

第一,资金。首先要看资金的日线是涨还跌,这代表了情绪面对于后市的看法,以及基本面的变化,比如加息。从资金面上就可以知道,在非单独极端行情的情况下,资金的持续增加才是开启上涨趋势的钥匙,而资金的持续下降就代表了购买力的抽离。

第二,存量。BTC存量代表了交易所的转入抛压,转出提现以及交易所的存量和头寸,这四个数据。交易所存量反应出的是当前砸盘的最大可能性。交易所头寸代表了主力交易所在吸筹还是在抛售。交易所的转入抛压意味着市场上恐慌情绪。交易所的提现代表了可能抄底用户的实力。

第三,流通量。这个数据包含的就是长短期持有人的信息,以及每天的URPD数据(BTC价格持仓变化)。这份数据可以清晰的告诉我们,目前是谁在卖出。[2022/6/19 4:37:50]

至北京时间11日18时,Blockchair团队的NikitaZhavoronkov@nikzh发表推特,解释事件的因果关系:

现场 | 观点:区块链有希望解决工业互联网的信任问题:金色财经现场报道,10月28日,第六届区块链全球峰会的分布式认知工业互联网主题论坛于上海开幕,在论坛的圆桌讨论环节,

思爱普中国陈泽平分享表示,工业互联网需要解决企业与企业间的信任问题,解决后会得到降本增效的效果。区块链有希望解决信任问题。例如企业对数据在供应链上下游的协同中有很大的需求。

钡比科技董事长许皆春分享表示,区块链最大的作用是解决数据的可信和可溯源。现在很多企业面临更多的是使用区块链提高效率,这需要对于业务流程需要非常熟悉。

联通上海分公司巴枫分享表示,运营商基于公共属性,在节点建设上,需要区块链的技术支撑,因区块链技术的成熟,才实现了企业数据共享的进步。[2020/10/28]

以太坊开发者某一次对代码的更改导致了当日以太坊区块链的分裂,分裂自区块高度11234873开始;

没有更新客户端的服务商,包括Blockchair和Infura,就因此受害,被留在了一个少数人组成的链上

观点:尽管减半后价格下跌,但比特币仍是最赚钱的产业:尽管经历了减半,但比特币的哈希率仍然相当高,网络健康程度也接近最大值。与BCH和BSV相比,比特币目前控制着总哈希率的97%以上,这是非常令人印象深刻的。数据追踪器Coin.Dance表示,尽管奖励减半后价格下跌,但比特币仍然是最赚钱的产业。(nulltx)[2020/5/13]

从技术上来说,这意味着发生了一次“未公开的硬分叉”

修复措施是升级geth客户端并运行debug.setHead(11234872)

他还表示,这件事绝不该被低估,应该被认为是TheDAO事件之后,以太坊区块链上最严重的一次事故。

确实很奇怪,为什么会有某个错误仅仅导致软件在某个时间以前的历史版本崩溃而现有版本不崩溃?这岂非意味着,不同版本的geth客户端的共识规则实际上不一样,也就是某时某刻发生了一次不能向后兼容的共识规则改变?此外,一个Infura的崩溃就导致了大面积的服务出错,这是否意味着Infura已经成了一个“单点故障”来源?

观点:黄金供应问题将很快得到解决,比特币不是避险资产:据此前报道,Coinbase发布报告表示,BTC相比黄金具有明显的优势,因为它不依赖实体供应链。同样作为稀缺、全球可获取的价值单位,比特币和黄金在本质上是类似的,但由于新冠病大流行的影响,黄金最近供应紧张,突显了比特币优越的全球可获取性。对此,英国杜伦大学金融与经济教授KevinDowd表示,“我想这些实物交付问题很快就会得到解决。我们最近买了一些黄金,交货延迟了,但只有三个星期。我不认为这种延迟与比特币有多大关系。”Dowd还表示,“我非常确信,随着比特币开采量接近极限,它将在未来遇到挖矿问题。当矿业耗尽时会发生什么?我们真的认为补偿矿工的价格会变得越来越高得离谱吗?还是你认为他们最终会被迫出局?”杜克大学国际商务教授CampbellHarvey表示不担心所谓的短期挤压。此外,黄金的年化波动率约为15%,这与股市差不多,但是“加密货币的波动性是巨大的,是黄金波动性的四五倍。这不是我所说的避险资产。”不过他也承认,纯粹的数字资产不需要实物装运,套利要简单得多,这是一个明显的优势。(Cointelegraph)[2020/5/10]

缘由

针对上面的两个问题,Geth客户端团队的领导者PéterSzilágyi@peter_szilagyi都有回应。

从技术上来说,的确可以说是发生了“未公开的硬分叉”,但这只是因为开发人员修复了一个沉睡了两年多的bug,而因为担心公开披露这个bug会导致以太坊遭到攻击,所以选择了静默修复。

人们也不该鄙视Infura没有使用最新的Geth客户端。从运营者的角度,不紧跟软件的最新版本是理性的。而依赖于Infura的服务,是自己把这个权利交出去了,而不是别人禁止了你运行节点,所以也没什么可抱怨的。

Peter的回应也引起了不同的反应。一位门罗社区的人表示,在2017年,他们也曾因为同样的顾虑而选择了静默修复bug。当然,也有人认为,选择静默修复是对的,但至少应该通知大型基础设施的提供者,只要联系了,就能大幅减少这一漏洞所造成的破坏。

北京时间12日凌晨5:34,Peter发布了《Gethv1.9.17客户端所造成破坏的事后报告》,定位了问题的来源:发布于2019年11月7日的Gethv1.9.7错误实现了EIP-211;JohnYoungseokYang在2020年7月15日报告了该问题,于是Geth团队在7月20日更新的v1.9.17版本中修复了这个问题。该次修复使得Geth客户端在执行涉及相关规则的交易时能跟其他以太坊客户端相一致,但却使v1.9.17版本与历史版本的Geth发生了不一致。

如Peter所述,这个过程完全不是为了引入某个以太坊社区不知道或者不同意的共识规则,仅仅是因为写了bug所以必须修复bug。除非你管写了bug也叫“硬分叉”,否则就没有理由管修复bug叫“硬分叉”。

其次,到底怎么发布修复,实际上并不简单。以太坊的硬分叉协调也需要很长时间。如果公开一个带有严重危险性的bug,在各节点升级的过程中难保不会有人尝试攻击。作为客户端开发者,他考虑的更多是以太坊网络的安全性,而不是某个服务的安全性。而且,他们也并不是对所有的bug都采取同样的静默修复措施,很多都是公开修复的。

12日上午7:11,Optimism团队的JingishiringforOptimism@jinglanW出来披露了更多信息:他们在6个月前复制了Geth客户端的代码库来研究和开发OptimisticVirtualMachine,在该过程中,他们发现了一个神秘的bug,也修复了该bug,但一直无法定位其来源;他们一直以为,这个bug可能跟团队引入的定制化改进有关,但11号他们开始怀疑错误就存在于旧版的geth客户端中,而不是因为他们引入了一些改进。于是他们看了ethernodes.org显示的节点分布之后,就决定在主网上测试该bug。因此有了后面的事情。

所以,实际上,是Optimism团队发现了一个bug,草率地决定在主网上测试该bug还存不存在,再加上Geth团队此前选择了静默修复该bug,才使得某些没有及时升级的节点出错了。

该如何理解和看待这件事情呢?

就事情的本因来看,这是因为客户端团队选择了静默修复一个沉睡了许久的bug。虽然很多人认为geth团队可以通过联系基础设施提供者来降低破坏,但我在这里还是认为,我们应该给客户端开发人员更多的信任和尊重。我相信Geth客户端团队这么做是有理由的,他们知道绝大部分节点都在使用自己的软件,也考虑了bug的沉睡时间,因此选择了静默修复。从事后诸葛亮的角度,当然提前通知了大的基础设施提供者会更好,破坏会更少。但是,这样吹毛求疵合理吗?为什么依赖于Infura的服务不假设Infura可能崩溃?

我承认我在这里不太公正,但更公正的话,也有很多人已经说过了。我在此只想表达我对geth客户端团队的敬意。我愿意把印象分给他们,因为他们在过去提供了许许多多的工作量证明。他们值得大家的尊敬。

在静默修复措施的执行上,当然存在提高的空间,也应该跟包括门罗和比特币社区学习经验。但如果只想着谴责geth团队,乃至以阴谋论来揣度他们,那才是更大的不公正。

关于“Infura是否成为了单点故障的来源”,也分简单的回答和复杂的回答。简单的回答是,不是,因为就像Peter所说,从来没有人禁止你部署节点,只是很多提供商自己选择了外包。Infura不是设计层面上必须经过的一个单点。只是因为各种各样的原因,它成了可能是最大的节点服务提供商。

但复杂的回答是,以太坊节点的资源消耗比较大,确实是一个被低估的问题。以太坊协议的运行需要各节点完全执行区块中包含的交易,而执行交易必须从状态数据中取出数据、并且完成后也要将结果写入,这个过程会涉及大量的硬盘随机读写。而且,随着状态数据体量的扩大,读写的效率要求也会提高。前些年热议的“状态膨胀”问题,在当前的以太坊上还没有解决。运行节点的门槛高,节点的数量自然就少。从善意的角度看,如果以太坊节点的运行门槛降低,我相信会有更多人自建节点,而不是选择依赖于Infura。

但这个问题的解决,同样依赖于以太坊客户端开发者和研究人员的智慧。无状态性,可以说是解决状态膨胀问题的终极方案。而在终极方案变得可行之前,我们仍然需要客户端开发者,为我们贡献更高效率的客户端。

所以,确实发生了一件事,也确实暴露出了一些问题、指出了我们学习和进步的方向。但解决这些问题,离不开我们对社区中不同团体的理解和尊重。远离阴谋论,远离恶意和自作聪明的嘲讽,弄清楚问题的根源,思考其实质和改进方案。我们做的事情,才决定了我们是谁。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金宝趣谈

[0:0ms0-5:679ms