阿里千问夺冠,GPT
11月4日,GPT备受关注的阿里AI大模型实时投资比赛“Alpha Arena”落下帷幕,阿里千问Qwen夺下最终的千问冠军。该竞赛由三方机构Nof1于10月18日发起,夺冠集合Qwen3-Max、GPTDeepSeek v3.1、阿里GPT-5、千问Gemini 2.5 Pro、夺冠Claude Sonnet 4.5、GPTGrok 4等全球六大顶尖模型,阿里每个模型拥有一万美元初始资金,千问在真实市场上无人工干预地自主决策、夺冠交易,GPT根据盈亏情况决出最后冠军。阿里历时17天,千问阿里千问Qwen以超20%的收益率夺得最后的冠军,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国顶尖模型全部亏损,GPT-5亏损超60%垫底。

AI大模型在各种性能基准榜单中屡创新高,如何评估大模型在真实、动态、竞争激烈的环境中的决策水平,是当下AI竞技场最受人关注的领域。美国人工智能研究实验室 nof1.ai 发布的“Alpha Arena”(阿尔法竞技场),向六大顶尖模型提供1万美元及金融市场的实时价格及各类指标数据,让大模型在真实市场中用真金白银进行投资比赛,全程没有人工干预 ,模型进行自主决策和交易,是AI处理实时变动的现实世界任务的真实评测,也因此成为近期最火热的AI大赛。
比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek成功领先,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

截至北京时间11月4日早上比赛结束,阿里千问凭借在关键时刻的紧急避险,最后关头超越DeepSeek,Qwen以超20%的胜率问鼎冠军;DeepSeek实现盈利,位列第二,两大中国模型成为唯二仍保持正收益的大模型;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损,Gemini 2.5 pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。
赛事主办方Alpha Arena的创办人Jay Azhang多次为阿里千问Qwen模型策略及表现点赞,并祝贺阿里千问最终赢得冠军。有业内专家指出,阿里千问和DeepSeek在实战中的优秀表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。
比赛链接:https://nof1.ai/
(责任编辑:百科)
- 生成超1000万份志愿报告,夸克实现国内最大规模深度研究应用
- 回归本质 涂料经销商从消费者出发
- 为什么要买寿险的宣传语,2021为什么要买寿险的宣传语
- 定制门窗热度不减 企业还面临哪些挑战?
- 科然小分子肽服用方法及亚健康人群有哪些调理反应?
- 寿险是不是越早买越好?为什么越早买保险越好?
- 中国银保监会发布《银行保险机构公司治理准则》
- 消费观念转变 十大门窗品牌要紧抓四点
- 汤臣倍健十年首亏3.56亿 保健品企业齐盼春天
- 银保监会关于警惕“投资养老”“以房养老”金融诈骗的风险提示
- 人寿保险到底能不能买?2021人寿保险到底能不能买?
- 什么是定期寿险的费率?2021定期寿险的费率是多少?
- 什么是黑科技减肥?黑科技瘦身有效果吗?奢女王黑科技瘦身
- 回归本质 涂料经销商从消费者出发
