设为首页 加入收藏
  • 首页
  • 热点
  • 娱乐
  • 探索
  • 焦点
  • 综合
  • 时尚
  • 当前位置:首页 > 时尚 > 阿里云百炼上线音视频实时互动功能,人人都能创建专属多模态应用

    阿里云百炼上线音视频实时互动功能,人人都能创建专属多模态应用

    发布时间:2026-01-11 21:18:56 来源:Trade Nation官网 作者:百科

    近日,阿里阿里云百炼上线了全新音视频实时互动功能,云百用用户可在百炼上自由选择文本、炼上语音和视觉理解等200多款模型,线音无需代码,视频实数分钟即可搭建一个能听、互动能看、人人会说的都能多模专属AI助手。阿里云百炼还支持以sdk的创建形式集成到Web、ioS和安卓应用,专属可应用于AI虚拟助手、阿里虚拟陪伴和AI老师等场景。云百用

     

    阿里云百炼上线音视频实时互动功能,炼上人人都能创建专属多模态应用

    用户在百炼上几分钟即可搭建一个能听、能看、视频实会说的专属AI助手

     

    过去一年,大模型正在从纯文本模态向语音和视觉等多模态演进,极大地拓宽了大模型应用的想象空间。然而现有单一模型仍旧无法处理复杂的任务,为了进一步加速单一大模型构建成像人一样自然交互的复杂AI应用,阿里云百炼提供了200多款语言模型Qwen、视觉语言模型Qwen2-VL、语音合成模型CosyVoice等全模态全尺寸大模型,同时联合阿里云AI实时互动方案,在国内率先为用户提供了便捷的工作流应用和智能体编排应用,例如支持构建RAG知识库、Prompt调优、sdk集成等。

     

    据介绍,在视觉理解模型方面,阿里云Qwen2-VL具备强大的视觉智能体能力,例如采用多模态旋转位置嵌入(M-ROPE)方法,能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,模型具备更好地理解和建模复杂的多模态数据,该模型一经推出就成为开源社区最受欢迎的多模态大模型;在音频方面,阿里云语音合成模型CosyVoice,通过对生成语音的情感、韵律进行细粒度的控制,情感表现力上得到明显提升,阿里云AI实时互动方案还可提供化智能降噪、智能打断、智能断句等超拟人对话能力。

     

    以搭建一个视觉能力的AI应用为例,用户进入百炼应用控制台后,仅需上传图片知识库、编写提示词、设置音频、调优这四步,数分钟内就能创建一个能完成专属视频交互的AI应用,基于Qwen-VL强大的视觉推理能力,它不仅能识别物体的种类,还能准确描述物体的风格、特点、位置以及物体上的文字等关键信息。此外搭建好的应用还支持以音视频sdk集成到用户的Web、ioS或者安卓应用中,帮助企业快速实现业务创新。

     

    据介绍,阿里云百炼上的通义API每百万tokens价格已降至0.3元,一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。


    • 上一篇:佛教中有四大菩萨及骑白象的是什么菩萨?
    • 下一篇:藤黄果为什么这么火?效果真有那么好吗?

      相关文章

      • 【好消息】绿洲动力买一送一了
      • 美式背景墙 为家居带来更温馨的感觉
      • 河南五年完成交通基础设施投资2430亿元 一半投向贫困地区
      • 分享开关面板与插座设计经验
      • 淘宝双12玩法公布:互动捡宝会场,认准金铲子标志
      • 衣柜十大品牌:揭秘衣柜选购要点
      • 锁具市场前景光明 企业需更新品牌创新模式
      • 万吨巨梁顶推 郑州上空两条巨龙将牵手
      • 至宝多肽一号与二号哪个好?各适合什么人吃
      • 五大法在手 不怕选不到优质的红木家具

        随便看看

      • 美团发布2024年Q3财报:营收936亿元 多措并举推动生态共赢
      • “双十一”购物狂欢 家具企业如何经营?
      • 上海重疾险怎么买,上海重疾险如何购买,上海重疾保险价格表
      • 河南冬天不太冷:总有一股“暖流”融化冰雪
      • 弘泽动力压片糖果是生命动力吗?是原来绿色动力吗?
      • 灯泡糖成“网红” 提醒:吞入灯泡糖不是耍酷是玩命
      • 广州分红终身寿险多少钱,广州分红终身寿险在哪买
      • 谨防市场陷阱 直击优质地板
      • 盘点碳纤维电地暖的五大过硬技术
      • 商业保险有必要买吗?商业保险到底有没有必要买?
      • Copyright © 2026 Powered by 阿里云百炼上线音视频实时互动功能,人人都能创建专属多模态应用,Trade Nation官网   sitemap