设为首页 加入收藏
  • 首页
  • 综合
  • 娱乐
  • 焦点
  • 时尚
  • 探索
  • 百科
  • 当前位置:首页 > 时尚 > 挑战高考数学完胜!商汤日日新多模态大模型权威评测第一

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一

    发布时间:2026-01-11 22:17:47 来源:Trade Nation官网 作者:百科

    刚刚,挑战商汤科技日日新SenseNova多模态大模型,高考在权威综合评测权威平台OpenCompass的数学商汤多模态评测中取得榜单第一。 挑战高考数学完胜!完胜威评商汤日日新多模态大模型权威评测第一 OpenCompass多模态大模型评测排名

    商汤日日新平均得分达到77.4,领先GPT-4o、新多型权Claude 3.5 Sonnet以及国内所有不同尺寸的模态开源和闭源模型。尤其在涵盖算术、大模统计、测第代数、挑战几何、高考数值常识、数学商汤科学和逻辑的完胜威评权威数据集MathVista维度上,取得78.4 分的日日最高分,展现了领先的新多型权“数理”能力。

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

    OpenCompass 多模态评测包含八个核心数据集,从多种视角客观量化多模态大模型的能力。此次评测中,商汤日日新在几乎所有维度上都达到或超过GPT-4o水平,其中四个维度上(MMStar、MathVista、OCRBench、MMVet)排名全球第一。

     OpenCompass大模型开放评测体系是上海人工智能实验室推出的,拥有完整开源可复现的评测框架,定期发布对各类大模型的评测成绩和排名。体系覆盖了语言与理解、常识与逻辑推理、数学计算与应用、多编程语言代码能力、智能体、创作与对话等多个方面,是对大模型真实能力各个维度的全面诊断。

    小试牛刀,商汤多模态进阶

    作为计算机视觉领域的先行者和领军企业,早在几年前,商汤就确定了多模态大模型的研究方向,并在研发中,融合积累的领先算法、丰富数据和场景认知建立起核心优势。

    2023年4月,商汤率先发布了行业领先的多模态大模型;

    2024年2月,基于商汤日日新4.0的多模态大模型,在当时权威评测基准测试集MME Benchmark上位列第一,综合得分达2199.5(超过GPT-4V的1926.57),并应用到智能驾驶、智能车舱、电力行业等多个场景;

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一

    2024 年7 月,商汤发布国内首个交互体验上对标GPT-4o的大模型——日日新 5o,实现无延时的实时流式交互。

    全新阶段,跨模态深度融合

    今年三季度以来,商汤已跨越初期探索,进入了多模态大模型的研发新阶段——实现跨模态深度融合。以此目标,商汤打造了全新原生多模态大模型——日日新SenseNova多模态大模型。

    跨模态深度融合指能够跨越不同模态(自然语言、代码、语音、图像、医疗影像、视频等)之间的鸿沟,充分利用不同模态的信息,通过跨模态逆渲染、多模态思维链等技术创新,实现数据之间的集成和交互。由此,模型的感知和理解能力将得到极大增强,并支持多模态融合推理的实现。

    跨模态融合有多种方法。例如,通过融合预训练以及后训练技术,商汤日日新多模态大模型大幅增强了数理逻辑和推理能力。

    评测中,当我们从“五年高考,三年模拟”里随机抽取几道高考数学题,日日新多模态大模型都可以轻松应对。

    提问:这道选择题要怎么做?

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

     

    商汤日日新输出结果,并给出详细解题过程: 

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

    提问:这道题要怎么解?请告诉我详细的思路

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

    商汤日日新输出结果: 

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

    商汤日日新再次输出正确结果。

    数学回答满分,再来看看物理。

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一

    商汤日日新输出结果: 

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

    物理题也答对啦~

    此外,通过多模态融合并对模型进行定向优化,商汤日日新多模态大模型还大幅提升了对统计图表和多模态文档的理解能力。

    评测中,当难度提升,让我们看看结果如何。

    提问:使用下表中的数据,计算2011年每股FCFE的金额。

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一

    商汤日日新输出推理结果:

    挑战高考数学完胜!商汤日日新多模态大模型权威评测第一  

    商汤日日新成功输出推理结果,效果令人惊叹。

    随着融合模态有效提升AI大模型性能,多模态融合未来可广泛应用于诸多场景,例如在线上教育、语音客服等场景,结合语音和自然语言来提升交互体验;在自动驾驶场景,融合视觉及多种模态数据,来提升感知精度和决策能力等。

    数理还只是起点。目前,日日新SenseNova多模态大模型已经可以通过API调用,即将开放普通用户体验。

    • 上一篇:东升伟业股票是否能上市
    • 下一篇:从华尔街到广告圈:金融量化分析方法用到广告投放,会有怎样的化学反应?丨鲸犀百人谈NO.32

      相关文章

      • 弘泽堂绿色动力和蓝色动力有什么区别?
      • LED企业想要谋发展 整合渠道资源是关键
      • 细数锁具行业零售市场的三宗“罪”
      • 转型是时代之需 涂料需提前做好准备
      • 天工AI推出彩页功能,聚焦AI阅读质感+创作效能
      • 掌握四大法 轻松购买优质的汽车玻璃膜
      • 大时代背景下 淋浴房企业变革发展是趋势
      • ChatGPT——引领创成式AI新变革
      • 海外仓投资十年都难回本 无法资本化快进快出
      • 郑州“一带一路”节点地位凸显 米字触角更舒展

        随便看看

      • 骑手真实收入揭晓:北上广深高频骑手月入过万
      • 开放赢未来 硅藻泥企业三大体系冲破牢笼
      • 供暖行业要转型升级 高效节能成为设计的关键
      • 浅析夏季购买壁挂炉的四大理由
      • 荣耀与腾讯签订深化战略合作协议
      • 李诗韵马国明5年之约怎么回事 马国明李诗韵是什么关系结婚了吗
      • 新国标下 空气净化器企业走品牌化道路
      • 弘康金玉满堂增额终身寿险值得买?有猫腻吗?
      • 蓝色动力压片糖果绿色生命动力压片糖果产品介绍
      • 抖音给陌生的你听在哪里听 M哥翻唱版给陌生的你听原唱是谁
      • Copyright © 2026 Powered by 挑战高考数学完胜!商汤日日新多模态大模型权威评测第一,Trade Nation官网   sitemap