阿里发布通义万相2.6系列模型 上线国内首个角色扮演功能
2025-12-16 15:16:09 来源:证券日报
本报讯 (记者梁傲男)12月16日,阿里推出新一代万相2.6系列模型。此系列模型针对专业影视制作与图像创作场景进行了全面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型。它同时具备音画同步、多镜头生成以及声音驱动等功能,是全球功能最为齐全的视频生成模型。据记者所知,万相2.6已同步在阿里云百炼、万相官网上线。
今年9月,阿里率先于国内发布音画同步的视频生成模型万相2.5,极大地提高了视频创作效率,在权威大模型评测集LMArena上,万相图生视频在国内位居首位。此次发布的万相2.6进一步增强了画质、音效、指令遵循等能力,单次视频时长达到国内最高的15秒,万相2.6还增添了角色扮演和分镜控制功能,不仅能够一键完成单人、多人、人与物合拍的视频,还能自动达成多镜头切换等专业任务,满足专业影视级场景的需求。
据介绍,通义万相在模型结构上整合了多项创新技术,可对输入的参考视频进行多模态联合建模与学习,参照具有时序信息的主体情绪、姿态以及多角度全面视觉特征,同时提取音色、语速等声学特征,在生成阶段作为参考条件加以控制,实现从画面到声音的全感官全维度一致性保持与迁移,目前万相可支持单人和多人的表演。
在分镜控制方面,通义万相能借助高层语义理解,将原始输入构建成为具备完整故事线与叙事张力的专业级多镜头段落,在多镜头顺畅切换的过程中保持核心主体、场景布局和环境氛围统一建模,确保全片在内容、节奏和氛围上具有高度一致性。
万相2.6的角色扮演功能使普通用户也能在影视级画面中展现精湛演技。比如,用户上传一段个人视频,并输入一段科幻悬疑风格的提示词,万相2.6能迅速完成分镜设计、角色演绎、画面配音等环节工作,生成一段镜头叙事完整、电影级运镜的短片,只需几分钟就能助用户实现电影主角梦。
即日起,所有人均可直接在万相官网体验万相2.6,企业用户还能通过阿里云百炼调用模型API,据悉,千问APP也将于近期上线该模型,并提供更丰富的玩法。
目前,万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域。
(文章来源:证券日报)
(文章来源:证券日报)
原标题:阿里发布通义万相2.6系列模型 上线国内首个角色扮演功能
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。



