Turbo-Geth作为一个纯粹出于好奇心的项目,始于2017年。一开始是为了探究基于trie的数据库模式的替代方案。在2018年3月,Turbo-Geth项目从以太坊基金会处获得了一笔小额的奖金。在2019年第一第二季度,Turbo-Geth被用作状态租金研究的状态分析平台。到了2019年第三第四季度,Turbo-Geth也被用于执行无状态以太坊的回溯检验。在Devcon5举办以前,我认为它在概念上已经很可靠了。
在Devcon5上,我提议在一年内不再接受EIP,好把所有的实现都转成类似的数据模式。但因为大家有所怀疑,而且「核心开发者」团体也没有这个积极性,我的提议没有被采纳。
怀疑意见主要围绕着高效计算和更新状态根哈希的方法。在2020年3月的EthCC2020大会上,我们提出了解决方案:额外的数据结构,叫做「中间哈希值」。接下来几个月里我们就完全实现了这个方案。
阶段式同步的想法来自于对按表写入变更量的测量值的观察。对数据变更的解决的方案是在一个预先排序号的序列中插入数据。我们在2019年末仔细观察了这些现象,但我们的第一个实验性的实现在2020年2月才表现出有重大的性能优势。
阶段式同步在架构层面上是一个非常重大的改变,我们在2020年3月至7月实现了这一功能。正是有了它,我们才能大幅压缩同步时间。
在2020年8月,我们又发现了将状态表示数据从50GB缩减到10GB的方法。
在2020年9月,「中间哈希值」功能的粒度做得更细,将计算状态根哈希的速度提升了4倍,同时将其数据规模从7GB减小到了2.5GB.
当前我们正在开发合适的日志索引
那么,这一切到底意味着什么呢?
其实,这都不意味着什么,因为当前的实现还没有到达效率的极限。
还有几个「未解之谜」:
对久远历史中的状态的默克尔证明还无法高效生成
一些共识计算无法与阶段性同步协调工作,理想情况下,应该共同设计两者
Silkworm
创建一个符合Apache2.0协议、用C++实现的模块化以太坊实现的想法,始于2019年初,因为那时我们看到「Aleth」项目基本上已经被放弃了。
但那并不是一个好时机。
到了2020年5月~6月,时机终于到来。出现了4大转机:
我们从BoltDB切换成了LMDB,这就能保证Turbo-Geth和Silkworm之间的数据库兼容性。
阶段式同步模式_自然而然地_将实现分解成了相对独立的组件,这些组件基本上都通过数据库中的记录来交互。这就意味着,我们可以逐个逐个组件创建C++实现。
更早的EVM实验暴露出了使用跨语言接口的巨大开销,而EVMC的双重接口又加剧了这一点。
我们觉得已经有了足够的经验,能在一个可预期的时间内、靠着一些专家的帮助,就能完成这一切了。
未来
启动Silkworm项目也打开了我们的思路,比如我们可以把实现逐个逐个地迁移到其它编程语言上。
我相信,以太坊1.0即使不引入分片,也能扩展至少10倍的吞吐量。我们主要面临三个方面的挑战:
区块的Gas上限更高会更容易招致DOS攻击。Turbe-geth的安全极限可能是其它实现的10倍高;而Silkworm可能会更高。
更高的Gas上限会产生更大的区块。这就会反过来产生两个问题:
区块传输问题。这可以通过预先共识来处理
区块下载和存储问题。可以通过使用专门化的存储网络比如BitTorrent来解决。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。