ChatGPT来做安全审计?Coinbase说还早呢_HAT:ATG

在人工智能热潮席卷全球的当下,“ChatGPT”无疑是近期互联网上最火的一个话题,而ChatGPT在区块链领域也引起了不小的争议,从最基础的“你问我答”到简单的行情分析,甚至是设计一套量化策略来炒币……ChatGPT的“超能力”也渗透进了区块链领域的每一角落。

上周,ChatGPT-4正式上线。据其开发商OpenAI表示,“ChatGPT-4在各种专业和学术基准测试中拥有人类水平的性能”。在实际应用中,ChatGPT-4在SAT考试中获得高分,并能成功监测出以太坊智能合约中的漏洞,甚至提出利用漏洞的潜在方法。

Coinbase主管ConorGrogan随即证实了这一点,他在社交媒体上表示,自己已在ChatGPT-4中插入了一个实时以太坊智能合约,结果AI瞬间就找到了安全漏洞,甚至还展示了如何利用这些漏洞进行攻击。ConorGrogan还表示,该合约的确在2018年被黑客利用漏洞攻击,此外他透露也尝试了Euler的智能合约,但由于合约过长而无法被ChatGPT-4处理。ConorGrogan坦言道,AI最终将使智能合约更安全、更容易构建。

数据:ChainLink巨鲸地址自3月份以来已增持价值约3.17亿美元的LINK代币:10月21日消息,区块链数据分析公司Santiment在推特上表示,Chainlink的巨鲸地址(持有1万至100万枚LINK)在2022年熊市期间一直在积极积累LINK代币。自3月3日以来,这些地址总共增持了4731万枚LINK到他们的钱包中,约合3.17亿美元。[2022/10/21 16:34:15]

随着这篇推文的发布,OpenAIChatGPT检测安全漏洞能力也成为了圈内最热门的话题之一,ChatGPT真的可以检查出去中心化应用的安全漏洞吗?准确率有多高?安全公司慌不慌?为了回答以上问题,Coinbase快速开展专项研究。

就在本周二,Coinbase在其官方博客中正式发布了利用ChatGPT使用ERC20代币审查框架来执行自动审查与区块链安全工程师执行审查的对比实验及其报告成果。

THORChain 总锁仓量达4.24亿美元:金色财经消息,据 DeFiLlama 数据显示,去中心化跨链交易协议 THORChain 总锁仓量达 4.24 亿美元,近 7 日增长近 34%。[2022/3/27 14:21:01]

实验的目的是通过将审查结果与区块链安全工程师执行的标准审查结果进行比较,以确定ChatGPT代币安全审查的准确性。实验中,区块链安全工程师将利用内部工具审查代币智能合约中的每个功能,并根据标记到功能的风险输出风险评分;同样,为了将ChatGPT的准确性与标准评审的准确性进行比较,也需要ChatGPT生成一个风险评分。

为了让ChatGPT使用Coinbase的ERC20安全审查框架生成风险评分,在此之前,Coinbase需要对ChatGPT下达部分指令:

加密返现电商平台StormX集成Chainlink喂价支持首次NFT销售:支持加密返现的电子商务平台StormX已集成Chainlink喂价,以支持其首次NFT销售。该集成已经在以太坊主网实施,使用Chainlink喂价的交易对为STMX/USD、ETH/USD和USDT/USD。[2021/7/12 0:45:21]

“我想让你担任区块链安全工程师。您的任务是根据与其功能相关的风险识别代币智能合约中的安全风险。这是我们的框架。以下智能合约中是否存在这些风险?、”如此,Coinbase便可在ChatGPT的提示中定义其风险框架,并询问它是否存在任何风险。

那么,ChatGPT的表现到底如何呢?

Coinbase在其实验中对比了ChatGPT和人工安全审查之间的20个智能合约风险评分,其中,ChatGPT12次生成了与人工审查相同的结果。然而,在另外8次失误中,有5次是ChatGPT错误地将高风险资产标记为低风险资产。

动态 | 多数BCHABC节点并未升级ABC客户端:BCHABC此前发布0.18.5版本,增加了深层重组保护。但在1071个BCHABC节点中,仅有大约99个节点进行了升级。[2018/11/26]

看似表现还可以,然而我们都知道,低估风险评分的后果比高估风险评分更加严重,可能就因为一不小心的低估风险导致上架部分高风险币种,这将严重危害交易所以及用户的权益。

根据实验结果所得出的报告显示,ChatGPT只能说“浅”具备了快速评估智能合约风险的能力,但并不符合Coinbase安全审查流程中的准确性要求:

首先,ChatGPT无法识别何时缺少上下文来执行稳健的安全分析。这会导致覆盖缺口,额外的依赖项并未被审查。为了防止任何覆盖缺口,每次都需要对ChatGPT的审查范围进行初步的分类。

其次,ChatGPT的输出可能不一致;当多次对ChatGPT输入同一个问题时,并总是输出相同的答案。ChatGPT似乎也受到代码中注释的影响,并且似乎偶尔会默认注释而不是函数逻辑。

最后,OpenAI继续迭代ChatGPT版本,导致额外的输出不稳定。过去可能用于提供一致输出的详细提示可能会在版本更改后产生替代输出。可能需要及时维护和输出质量控制,以确保一致的响应并避免任何操作故障。

综上所述,或许,Coinbase可以通过进一步工程设计,提高ChatGPT代币安全审核的准确性。不过目前,Coinbase依旧无法仅单独依靠ChatGPT来执行安全审查。Coinbase希望未来可以提高其准确性,将ChatGPT作为二次QA检查的工具,从而使安全工程师可以利用该工具执行额外的控制检查,以捕捉可能被忽略的任何风险。ChatGPT提示将被保存以供工程师将来使用,并计划在以后进行改进。

正如Coinbase的实验一样,我们可以通过调节ChatGPT的指令设计来进一步提高其准确性,但是对于安全审核这样偏机动性的工作而言,单靠ChatGPT使无法保证能在变量无法统一的情况下做出准确判断的,仍然需要进行人工干预,根据具体额外的控制检查来改进ChatGPT的提示。

总得来说,在区块链行业引入AI,无疑给圈内创企提供了通过人工协作AI进行高效build的可能——ChatGPT拥有广泛的知识库,人工输入特定的业务逻辑和提示,而开发人员可以通过使用ChatGPT在更短的时间内完成更多的工作。此外,对于安全工程师对智能合约审计的高成本而言,ChatGPT提供了一种及时且经济高效的合约审计辅助。

就像区块链开发人员SalmanArshad在ETHDubai会议上回答的那样,“ChatGPT和AI工具是福音;他们不是我们的敌人,也不是用来结束开发者职业生涯的。”ChatGPT的协作性质,与自动化流程和取代人工的潜在威胁相比,或许对于广大用户更大有利。

最后,我想问作为用户的你,是否敢使用接受ChatGPT审计过的DeFi协议呢?

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金宝趣谈

[0:0ms0-5:367ms