蚂蚁百灵发布轻量级推理模型 Ring
近日,蚂蚁据百灵大模型公众号,百灵蚂蚁百灵团队发布并开源了Ring-mini-2.0推理模型。发布它是轻量基于此前蚂蚁百灵发布的基础语言模型 Ling 2.0 架构,深度优化的理模高性能推理型 MoE 模型。它在总参数量16B、蚂蚁仅激活1.4B参数的百灵情况下,即可达到10B级别以下dense 模型的发布综合推理能力,尤其在逻辑推理、轻量代码与数学任务中表现卓越,理模并支持 128K 长上下文及 300+ token/s 的蚂蚁高速生成。
经过 Long-COT SFT、百灵更稳定持续的发布RLVR以及RLHF联合优化,Ring-mini-2.0复杂推理的轻量稳定性与泛化性得到显著提升。在多项高难度基准(LiveCodeBench、理模AIME 2025、GPQA、ARC-AGI-v1 等)中,在输出长度相当的情况下,Ring-mini-2.0性能显著超越10B以下dense 模型,甚至媲美更大参数量的MoE模型(如 gpt-oss-20B-medium),在逻辑推理方面尤为突出。

(Ring-mini-2.0性能表现)
据了解,Ring-mini-2.0继承了Ling 2.0 系列的高效 MoE 设计,仅激活 1.4B 参数,通过 1/32 专家激活比、MTP 层等架构优化,达到约 7–8B dense 模型的等效性能。得益于小激活、高稀疏度的设计,Ring-mini-2.0 在H20 部署下实现 300+ token/s 的吞吐,结合 Expert Dual Streaming 推理优化后可进一步提升至 500+ token/s,大幅降低高并发场景下 Thinking 模型的推理成本。同时,借助 YaRN 外推可支持 128K 长上下文,长输出场景下相对加速比最高可达 7 倍以上。
蚂蚁百灵团队表示将完整开放 Ring-mini-2.0 的模型权重、训练数据和 RLVR+RLHF 训练策略。凭借“小而优”的特点,Ring-mini-2.0 有望成为小尺寸推理模型的首选,为学术和工业界提供理想的研究与应用起点。
(责任编辑:休闲)
- 安心出游放心消费 江苏省南京市着力营造安全放心消费环境
- 朱婷世俱杯力争率瓦基弗卫冕 浙江小组出线不易
- 威少赛后主动为失误揽责 亚当斯为全队防守点赞
- 恶性竞争损害整个涂料行业的利益
- 世盟将逐步为产品卡图巴更换包装
- 勇士1替补20+9以一抵五 末节轰11分创新高险擒龙
- 网络推行成为著名涂料品牌开启推行形势的中坚力量
- 小编从油墨安全到油墨温度教你储存油墨
- 建设“双一流” 需要“大奋斗” 谢伏瞻赴郑大、河大调研
- 小学生意外险包括哪些范围?小学生在学校买的意外险都包含什么
- 意外保险多少钱1年?2022意外保险多少钱1年
- 恒大后防2将或加盟升班马 等待冬窗开启完成转会
- 豆包上线未成年人模式 默认关闭相关视频展示等功能
- 拉姆曾向伍兹请教推杆被“嘲笑”感恩其为高球贡献
