英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型

人脑网 4 月 12 日消息,科技媒体 marktechpost 昨日(4 月 11 日)发布博文,报道称英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1,这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型

随着 AI 在数字基础设施中的普及,企业与开发者需在计算成本、性能与扩展性间寻找平衡。大型语言模型(LLM)的快速发展提升了自然语言理解和对话能力,但其庞大规模常导致效率低下,限制大规模部署。

英伟达最新发布的 Llama-3.1-Nemotron-Ultra-253B-v1(简称 Nemotron Ultra)直面这一挑战,该模型基于 Meta 的 Llama-3.1-405B-Instruct 架构,专为商业和企业需求设计,支持从工具使用到多轮复杂指令执行等任务。

人脑网援引博文介绍,Nemotron Ultra 采用仅解码器的密集 Transformer 结构,通过神经架构搜索(NAS)算法优化,其创新之处在于采用跳跃注意力机制,在部分层中省略注意力模块或替换为简单线性层。

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型

此外,前馈网络(FFN)融合技术将多层 FFN 合并为更宽但更少的层,大幅缩短推理时间,同时保持性能。模型支持 128K token 的上下文窗口,可处理长篇文本,适合高级 RAG 系统和多文档分析。

在部署效率上,Nemotron Ultra 也实现突破。它能在单 8xH100 节点上运行推理,显著降低数据中心成本,提升企业开发者的可及性。

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型

英伟达通过多阶段后训练进一步优化模型,包括在代码生成、数学、对话和工具调用等任务上的监督微调,以及使用群体相对策略优化(GRPO)算法进行强化学习(RL)。这些步骤确保模型在基准测试中表现出色,并与人类交互偏好高度契合。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/4688.html

(0)
人脑网的头像人脑网
上一篇 2025年4月12日 下午3:04
下一篇 2025年4月12日 下午3:05

相关推荐

  • 小巧机身也能满血释放天玑9400+?OPPO Find X8s性能实测解析

    此前很多用户都认为小屏手机的性能释放难以比肩大屏手机,因此对于小屏手机的性能体验抱有疑虑。然而随着OPPO Find X8s的面世,用户对于小屏手机的这一“刻板印象”将会被打破。作为新一代的小屏性能旗舰手机,OPPO Find X8s不但搭载了新一代旗舰手机处理器天玑9400+,在实现了满血的性能释放同时搭配潮汐引擎可以为用户带来了远超同类机型的性能体验。 …

    2025年4月11日
    1300
  • 特斯拉副总裁陶琳:国内已建成超过 2000 座超充站

    人脑网 4 月 6 日消息,特斯拉副总裁陶琳今日发文称,国内充电网络布局不断拓展,已经建设超过 2000 座超充站,100% 覆盖中国内地所有省份和直辖市,其中还有 450 多座已经对其他一些品牌的车主开放。 同时她表示,根据特斯拉的《2023 年影响力报告》,近五年来特斯拉充电桩的正常运转率一直保持在 99.7% 以上,并且稳步提升到了 99.97%。车主…

    2025年4月6日
    800
  • 腾讯手机管家怎样开启QQ保护

    有些朋友想用腾讯手机管家开启QQ保护,却不知如何操作。下面来教大家方法。 1、 在手机桌面上找到并点击进入腾讯手机管家。 2、 点击保护我的QQ选项。 4、 点击本机号码,一键验证。 5、 点击箭头,绑定密保令牌。 6、 最后点击完成即可。

    2025年4月18日
    600
  • 首发骁龙8至尊领先版!荣耀GT Pro刷新性能天花板

    【ZOL人脑网原创新闻】2025年4月21日,荣耀GT Pro官宣将会首发搭载备受瞩目的新款旗舰手机SoC:骁龙8至尊领先版。荣耀GT系列作为荣耀旗下主打性能体验的产品系列,其已经发布的荣耀GT以强劲的性能和亲民的价格定位赢得了用户的一致好评。 本次公布荣耀GT Pro将搭载骁龙8至尊领先版的消息也无疑拉高了用户群体对于荣耀GT Pro期待,更是让这款尚未发…

    2025年4月21日
    1100
  • 字节跳动VAPO突破AI推理极限,AIME24创60.4分新高

    人脑网 4 月 12 日消息,字节跳动于 4 月 8 日发布博文,其 Seed 研究团队推出 VAPO 强化学习训练框架,目标提升大型语言模型在复杂、冗长任务中的推理能力。 现有挑战 在大型语言模型(LLM)的强化学习(RL)训练中,价值导向方法(Value-based reinforcement learning methods)因能精确追溯每个动作对后续…

    2025年4月12日
    1700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信