AMD发布首个AI小语言模型：6900亿token（amd语言设置） - 做妈妈育儿网

请选择时期：

怀孕准备怀孕分娩宝宝0-1岁宝宝1-3岁宝宝3-6岁

当前位置：首页 > 窍门 > 科技数码

AMD发布首个AI小语言模型：6900亿token（amd语言设置）

来源：最后更新：24-10-03 02:55:40

导读：AMD发布首个AI小语言模型：6900亿token

　　AMD发布了自己的首个小语言模型(SLM)，名为“AMD-135M”。

　　相比于越来越庞大的大语言模型(LLM)，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。

　　AMD-135小模型隶属于Llama家族，有两个版本：

　　一是基础型“AMD-Llama-135M”，拥有多达6700亿个token，在八块Instinct MIM250 64GB加速器上训练了六天。

　　二是延伸型“AMD-Llama-135M-code”，额外增加了专门针对编程的200亿个token，同样硬件训练了四天。

　　它使用了一种名为“推测解码”(speculative decoding)的方法，通过较小的草稿模型，在单次前向传播中生成多个候选token，然后发送给更大的、更精确的目标模型，进行验证或纠正。

　　这种方法可以同时生成多个token，不会影响性能，还可以降低内存占用，但因为数据交易更多，功耗也会增加。

　　AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型，测试了推测解码使用与否的性能。

　　比如在MI250加速器上，性能可提升最多约2.8倍，锐龙AI CPU上可提升最多约3.88倍，锐龙AI NPU上可提升最多约2.98倍。

　　AMD-135M小模型的训练代码、数据集等资源都已经开源，遵循Apache 2.0。

　　按照AMD的说法，它的性能与其他开源小模型基本相当或略有领先，比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M，Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

标签: 首个模型语言

免责声明：本文系转载，版权归原作者所有；旨在传递信息，其原创性以及文中陈述文字和内容未经本站证实。

本文地址:http://www.zuomama.com/qiaomen/youxi/1316214.html

美国载人“龙”飞船与国际空间站对接
网站首页 返回栏目
暂无

1
中国移动初始服务密码中国移动初始服务密码6位

2
手机白屏怎么快速修复手机白屏怎么快速修复求视频

3
mq是什么意思（为什么使用MQ） mqms是什么意思

4
如何注销探探账号如何注销探探账号和密码

5
比心怎么接单比心怎么接单赚钱2023

6
联通流量封顶怎么解除（联通流量封顶怎么解除后怎么收费）

7
拼多多运费险退回来的钱在哪里拼多多运费险退回来的钱在哪里提现

8
12306积分怎么用（12306积分怎么用不了）

9
中国移动初始服务密码（中国移动初始服务密码8位）

10
天津河北区保租房在哪里天津河北区租房房源

如何注销探探账号如何注销探探账号和密码

最好听的几首歌古风歌推荐（最好听的歌曲前十名古风歌曲）1、《故人不散》这首歌原创是醉雪和纱朵，纱朵小姐姐的声音真的是
具有历史意义的电视剧具有历史意义的电视剧排行榜天津红桥区有保租房吗天津红桥区有保租房吗多少钱琉璃美人煞电视剧演员表（琉璃美人煞电视剧剧情介绍电视猫）三十而已钟晓芹和陈屿复合了吗三十而已陈屿钟晓芹离婚片段台词

2024保运集团医院妇女节健康体检优惠活动一览

2024年保定第七医院妇女节体检优惠活动一览

何谓有特色的淘宝店何谓有特色的淘宝店铺名字何谓有特色的淘宝店？可以用简单的两个字—“专业”来概括。本站来
中国的希望在延安福建省大中小学同上一堂思政课完整视频苹果手机官换机是什么意思（ipone官换机什么意思）天津津南区保租房具体地址（天津津南区保租房具体地址查询）胡歌繁花演员表（胡歌繁花演员表名单）

夏洛特烦恼为什么喜欢秋雅夏洛特烦恼秋雅怎么得艾滋病的

栏目导航

怀孕周期

热门文章

关于我们 | 广告服务 | 网站合作 | 免责声明 | 联系我们| 网站地图

© 2006-2022 做妈妈育儿网 all rights reserved. 浙ICP备2022035435号-3

声明：本站文章均来自互联网，不代表本站观点如有异议请与本站联系联系邮箱:kf#zuomama.com (请把#替换成@)