两大可商用开源大模型同时发布！性能不输 LLaMA，羊驼家族名字都不够用了_POO:RAD

来源：量子位

从Meta的LLaMA发展出的羊驼家族一系列大模型，已成为开源AI重要力量。

但LLamA开源了又没全开，只能用于研究用途，还得填申请表格等，也一直被业界诟病。

好消息是，两大对标LLaMA的完全开源项目同时有了新进展。

可商用开源大模型来了，还一下来了俩：

MosaicML推出MPT系列模型，其中70亿参数版在性能测试中与LLaMA打个平手。

Together的RedPajama系列模型，30亿参数版在RTX2070游戏显卡上就能跑。

数据：ZEN 24H涨幅37.5%，领涨隐私币和灰度信托两大概念:据MXC抹茶行情数据，ZEN 24H涨幅37.5%，现报27.57USDT，领涨隐私币和灰度信托两大概念。其他隐私概念资产，XZC涨幅10.72%，现报4.065USDT；XMR涨幅9.74%，现报169.91USDT。另外，XMR3L涨幅40.13%。灰度信托基金CEO曾发推认为，2021是隐私元年。[2021/1/12 15:58:07]

对于这些进展，特斯拉前AI主管AndrejKarpathy认为，开源大模型生态有了寒武纪大爆发的早期迹象。

MPT，与LLaMA五五开

MPT系列模型，全称MosaicMLPretrainedTransformer，基础版本为70亿参数。

欧科云链李炼炫：“信息壁垒”和实物上链是影响区块链落地的两大挑战:欧科云链研究院首席研究员李炼炫认为，“信息壁垒”和实物上链是当前影响区块链技术实际产业落地的两大挑战。一是存在“信息壁垒”，区块链技术要发挥作用，跨部门、跨领域是关键。但是，目前问题在于难以打通各部门、各企业之间的壁垒。如果各参与方不愿意共享数据，区块链就没有数据之源，形成“数据孤岛”。二是实物上链问题，即目前难以保证线下实物可真实准确地“上链”。打破这一壁垒，需要物联网等配套成熟技术的支撑。李炼炫提醒，在加速区块链产业应用过程中，需要注意哪些应用是区块链的真需求，哪些是假需求，要保证区块链技术能切实解决场景应用痛点，并注重“脱虚向实”，防止利用区块链技术进行炒作等。（经济参考报）[2020/10/15]

MPT在大量数据上训练，与LLaMA相当，高于StableLM，Pythia等其他开源模型。

支持84ktokens超长输入，并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。

公告 | FORTUNA方图公链测试网络与web钱包上线，FOTA同步上线两大新交易所:2018年6月25日，方图公有链测试网络成功上线，目前支持创建账户、转账、注册代理人、投票、区块与交易查询等功能。同时，首款web版数字钱包提前发布。此外，方图代币FOTA将上线两大全新交易所，累计上线海外交易所11家。[2018/6/25]

在各类性能评估中，与原版LLaMA不相上下。

除了MPT-7BBase基础模型外还有三个变体。

MPT-7B-Instruct，用于遵循简短指令。

MPT-7B-Chat，用于多轮聊天对话。

MPT-7B-StoryWriter-65k+，用于阅读和编写故事，支持65ktokens的超长上下文，用小说数据集微调。

比特币现金两大平台涨幅超20%:目前在Bitfinex平台BCH达到2855.2美元，最近24小时涨幅高达21.2%。在币安平台目前价格为2880美元，涨幅高达22.85%。[2018/1/11]

MosaicML由前英特尔AI芯片项目Nervana负责人NaveenRao创办。

该公司致力于降低训练神经网络的成本，推出的文本和图像生成推理服务成本只有OpenAI的1/15。

RedPajama，2070就能跑

RedPajama系列模型，在5TB的同名开源数据上训练而来。

除70亿参数基础模型外，还有一个30亿参数版本，可以在5年前发售的RTX2070游戏显卡上运行。

目前70亿版本完成了80%的训练，效果已经超过了同规模的Pythia等开源模型，略逊于LLamA。

预计在完成1Ttokens的训练后还能继续改进。

背后公司Together，由苹果前高管VipulVedPrakash，斯坦福大模型研究中心主任PercyLiang，苏黎世联邦理工大学助理教授张策等人联合创办。

开源模型发布后，他们的近期目标是继续扩展开源RedPajama数据集到两倍规模。

OneMoreThing

来自南美洲的无峰驼类动物一共4种，已被各家大模型用完了。

Meta发布LLaMA之后，斯坦福用了Alpaca，伯克利等单位用了Alpaca，JosephCheung等开发者团队用了Guanaco。

以至于后来者已经卷到了其他相近动物，比如IBM的单峰骆驼Dromedary，Databricks的Dolly来自克隆羊多莉。

国人研究团队也热衷于用古代传说中的神兽，如UCSD联合中山大学等推出的白泽。

港中文等推出的凤凰……

最绝的是哈工大基于中文医学知识的LLaMA微调模型，命名为华驼。

参考链接：

https://www.mosaicml.com/blog/mpt-7b

https://www.together.xyz/blog/redpajama-models-v1

https://twitter.com/karpathy/status/1654892810590650376?s=20

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

欧易okex官网我如何逃过一场 Azuki 局？_POOL:Regular Presale

撰文：Kouk.eth?我想要讲述一个故事,我的AzukiNFT差点被走。事情开始于一条看似无害的Discord消息,有人为我的Azuki给出了一个诱人的报价.

AVAXForesight Ventures: DEX范式的变迁与发展

原文作者：Kylo,ForesightVentures Tips: AMM与RFQ实际代表着DeFi和TradFi思维模式的差别AMM提高资金利用效率的方式是通过LP杠杆化实现的RFQ模式对于跨.

火币交易所Meme 热潮席卷比特币网络 BTC是否“见顶”_MEME:比特币

随着基于比特币BRC-20标准的Meme代币交易量飙升至两年高位,比特币周一跌破2.75万美元,链上数据显示,从历史数据来看,模因币的投机狂热预示着比特币短期“见顶”或者看跌逆转.

币安交易所app下载香港SFC为虚拟资产交易平台申领牌照提供过渡安排_虚拟资产:SQUA价格

金色财经报道,香港证券及期货事务监察委员会6月1日将正式落实虚拟资产服务商新发牌制度,为给现时在香港营运的虚拟资产交易平台提供合理足够时间,以便申领牌照或以有序方式结业,香港政府提供过渡安排.

金宝趣谈

两大可商用开源大模型同时发布！性能不输 LLaMA，羊驼家族名字都不够用了_POO:RAD

金宝趣谈