近日,加密数据查询网站Dune宣布更新其LLM路线图,首期上线GPT-4支持的查询解释功能,后期将会逐渐增加更多功能,比如自然语言查询、SQL语句转义和优化搜索等。不同于其他数据分析网站付费查询商业化路线,Dune在上线后始终对普通用户免费开放,因此在上轮的牛市周期沉淀了足够多的用户量,而LLM的加入,则有望使其沉淀的数据查询语句、看板转化为实际的杀手锏,并且引导普通用户加入创作者行列。Dune的数据查询鸿沟
得益于区块链数据的公开性和透明度,任何人都可直接访问区块链数据,但是原始数据往往难以辨认,非专业程序员很难看懂其含义,但是其上的数据蕴藏着巨大的经济价值,因此各类数据分析工具便应运而生,为各类分析师、研究员和普通散户提供间接访问和深度分析的工具。
Dune在其中最为引人注目,因为其提供了真正自由且强大的分析工具,任何人都可通过SQL语句进行对数据的查询、分享和展示,甚至部分项目直接选择Dune作为官方信息展示平台。但是Dune的SQL查询功能,表面看是UGC模式,平等的赋予每一个用户权限去执行查询任务,但实际上Dune采纳的SQL模式存在两个问题,其一是门槛过高,SQL是的简写,比如查询Uniswap上以DAI作为交易对的数量,仅仅需要5行代码即可完成。但是一旦执行查询的逻辑变得复杂,其代码量可能会大幅增加,非专业程序员很难自行写出,这导致大量用户只能成为看客。
数据:日均交易所充值BTC地址数重回2017牛市水平:9月23日,区块链追踪和研究机构Glassnode发推表示,目前,每日向交易所充值BTC的地址数相比年初水平已经翻倍。现在每天共有10万个地址向交易所发送BTC,而上一次出现类似水平实在2017年牛市。[2020/9/23]
例如,官方进行简化后的"nft.trades"查询流程,包含了近20万行的SQL语句转换、10万行的测试代码,并且由55个社区成员参与其中,单个用户无法处理如此大规模的任务。
其二是Dune的V1和V2版本的之间支持的SQL标准并不统一,V1和V2分别使用的PostgreSQL和SparkSQL,后续计划由DuneSQL完成统一。在本次升级LLM功能之前,Dune已经在准备统一查询引擎,计划在今年7月份之后全部迁移至DuneSQL,以保证产品逻辑的统一性。更新后的DuneSQL是基于开源查询引擎Trino的实现,Dune对其进行优化,以适配Dune自身的需求,与流行的SparkSQL并无本质上的差异,更多是在具体函数和语法上的改进。比如DuneSQL提供了更多的运算符,方便快速对日期和时间进行计算,以及对管理权限进行限制,所有涉及对原始数据本身的删除、更新等操作均无法执行,以保证数据的安全性。
BCH持续快速反弹 重回230美元上方:据火币全球站数据显示,BCH在最低跌至221.63美元后持续快速反弹上涨,现已重回230美元上方,当前报价为232.07美元,日内跌幅缩窄至0.16%,行情波动较大,请注意风险控制。[2020/4/12]
但是SQL查询门槛过高的问题,依旧无法通过更改SQL范式得到解决,这意味着大多数用户和程序员都要去适应新的语法格式,比如说针对具体的查询语句,新用户和程序员都要去适应。而对自动化工具的需求,不仅对于普通用户具备现实意义,对不熟悉新语法的程序员也大有裨益。实际上,在迁移DuneSQL路线图中,Dune已经在尝试实验自动化工具,可以将不同的语法格式统一转化为DuneSQL语句,而在GPT-4使用LLM显示人机交互方面的威力后,Dune也顺势推出自己的LLM计划。LLM:解锁普通用户的参与感
美、布两油持续反弹 布油重回26美元上方:美、布两油持续反弹,布油重回26美元上方,日内跌幅收窄至1.34%,WTI原油升至23美元上方,现涨2.59%。美国天然气期货短线拉升,现报1.6380美元/百万英热。[2020/3/20]
Dune的典型流程是解构链上数据,专业用户通过SQL执行查询,随后将看板分享给有需要的用户。在这个流程中,最关键的是执行查询,而大多数用户因为缺乏代码知识而无法使用查询功能。而在引入查询解释功能后,上述流程发生一些微调,在专业用户写的SQL查询界面,会出现解释页面,以自然语言的格式直观地告诉查看用户代码的具体作用,相当于给SQL查询添加一个解释说明的补丁,并不会改变当前的工作流程,这也是团队在吸取合并SQL语句时的教训,即降低对用户既有习惯的干扰,而是尽可能在现有流程优化体验。
行情 | BSV短时上涨超6% 现已重回270美元上方:据火币全球站数据显示,BSV短时快速上涨超6%,现已重回270美元上方,当前报价为 272.79美元,日内跌幅约为4.28%,行情波动较大,请注意风险控制。[2020/1/24]
在LLM加入后,一定程度上抹去了专业用户和普通用户的能力差异。借助GPT-4对代码的理解能力,可以让普通用户直观的理解查询语句的作用,而无需掌握SQL知识。在此功能引入前,用户只能被动的在看板页面阅读图表,而在引入查询解释功能后,普通用户也可以理解SQL代码是发挥作用的具体含义。比如说Alice想要查询LayerZero交易的相关信息,那么她可以直接找到Bob已经制作好的Dune看板,可以发现49.4%的用户都集中在1次,那么Alice有理由推断说明这是为了潜在的经济刺激而进行的虚假交易,但是无法一锤定音,因此Alice决定去翻阅代码检查结论是否可靠。
金色晨讯 | 加密货币市值重回2400亿美元 京东用区块链防伪溯源:1.加密货币总市值8月7日以来首次重回2400亿美元。
2.教育部:严禁通过任何形式在校园推介非法集资活动。
3. 加州联邦法院接受数字货币保释金支付。
4.中国工商银行计划开发基于区块链技术的服务。
5.京东全球购设日本采购中心并使用区块链防伪溯源。
6.MinerGate已撤下挖矿功能却仍被谷歌删除。
7.狄刚:应积极推进以区块链技术服务于现实需求的应用落地。
8.塞尔维亚总理:数字机遇巨大,区块链技术就是其中之一。
9.BTG团队回应Bittrex:既无能力也无责任支付网络安全赔偿金。[2018/9/5]
但是Alice发现虽然结果只有5行数据,但是查询代码足足有150行,Alice的SQL水平不足以确认每个语句的正确性,而此时查询解释功能则会“翻译”代码的具体说明,如图所示,查询分成了3个部分:收集数据涵盖了Arbitrum、Avalanche、BNB、Ethereum、Optimism、Polygon和Fantom等多条链,并且第二部分是计算每个用户的交易数量。第三部是针对数量设置阈值对用户进行分类:1Tx','2~5Tx','5~10Tx','10~20Tx',和'>=20Tx'。
那么此时Alice可以在不理解Bob写的代码含义基础上去进行分析和判断。本质上,查询解释的功能相当于给代码和人类之间进行了一次转义和翻译,那么反过来,也可以将人类语言翻译成SQL语句,在LLM加持下,得益于Dune攒下的海量查询语句数据,这并不难实现。自然语言查询就是Dune后续LLM改进的重要方向。自然语言查询可以让用户以传达指令的方式去执行图表生成任务,这比使用SQL语句、拖曳生成等模式更为符合普通人的思维方式,免去对实现细节的关注。并且,自然语言查询并不是对专业用户,如分析师群体的替代功能,而是一种补强,现存的Dune有将近70万个图表,相当一部分的分析任务是重叠和冲突的,而使用自然语言查询,也有助于系统去理解图表之间的关联,从而进一步提升整个分析工作的效率。在LLM加入后,现存图表、SpellBook和文档数据也将被重新整合,效仿OpenAI的聊天机器人,Dune也会开发对话机器人,帮助用户以更简易的方式去理解和利用现存的知识体系,而不需要受到不相关信息的干扰。比如,Alice可以将上述查询LayerZero用户交易量分布的情况逆置,先用英语发出查询指令,并且交代好每一步的工作流程,随后Dune会帮助Alice写好150行代码,随后生成图表。
结语:人人都能当数据分析师
Dune的目标并不是建立一个单纯的链上数据分析平台,而是希望打造一个可以使信息自由流动的数据管道,允许用户抓取、转换、管理、查询、可视化以及利用数据去采取行动。数据流动的前提是必须进行模块化,可任意组合和配置,最终建造社区共享的数据集,而不是集中在复杂的SQL语句或者付费API之内,最终达到人人都可和数据进行交互的平权图景。概要而言,Dune的LLM计划是“翻译”和助手,目标是让普通用户读懂数据所代表的一切,不仅是最终结果的展示,而是深入到生成过程之中,最终人人都可进行链上数据分析。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。