9 月 29 日消息,AMD 在 Huggingface 平台公布了自家首款 " 小语言模型 "AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,附模型地址如下。
据介绍,这款模型主打 " 推测解码 " 能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。
AMD 表示,这款模型在四个 AMD Instinct MI250 节点训练了六天,其 " 编程专用版本 " 变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。
发布日期: 2024-05-06
发布日期: 2024-11-12
发布日期: 2024-04-26
发布日期: 2024-10-25
发布日期: 2024-07-03
发布日期: 2023-07-04
发布日期: 2024-01-06
发布日期: 2024-11-26
发布日期: 2024-12-20
发布日期: 2024-12-20
发布日期: 2024-12-20
发布日期: 2024-12-20
发布日期: 2024-12-20
寻找更多销售、技术和解决方案的信息?
广州绿测电子科技有限公司(简称:绿测科技)成立于2015年11月,是一家专注于耕耘测试与测量行业的技术开发公司。绿测科技以“工程师的测试管家”的理念向广大客户提供专业的管家服务。绿测科技的研发部及工厂设立于广州番禺区,随着公司业务的发展,先后在广西南宁、深圳、广州南沙、香港等地设立了机构。绿测科技经过深耕测试与测量领域多年,组建了一支经验丰富的团队,可为广大客户提供品质过硬的产品及测试技术服务等支持。
技术工程师
销售经理
020-22042442
广东公司:冯经理
020-2204 2442-9-822
广西公司:何经理
020-2204 2442-9-880