AMD推出完全开源的3B参数语言模型Instella
媲美Llama-3.2-3B和Qwen2.5-3B

3 月 6 日消息,AMD 今日宣布,为 Radeon RX 9070 系列开源 Linux 驱动程序,还宣布开源 Instella —— 一个完全开源的 3B 参数语言模型

AMD Instella 代表“完全开源的尖端 30 亿参数语言模型(LMs)”。这些模型在 AMD Instinct MI300X GPU 上进行了训练,根据 AMD 发布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等相媲美。

0.png

AMD Instella 模型是在 Instinct MI300X 硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。


Magazine.Subscription.jpg

通知公告
编辑观点
理事会
参考资料
版权声明

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。

《网络安全与数据治理》(原《信息技术与网络安全》)编辑部