腾讯混元发布并开源HunyuanVideo 1.5 元宝上线生视频能力
2025-11-21 17:02:00 来源:上海证券报·中国证券网
上证报中国证券网讯(记者谭镕)11月21日,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5。此乃一款基于Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,能支持生成5至10秒的高清视频。当下,腾讯元宝最新版已上线该模型能力。用户可通过两种途径体验:其一,输入文字描述(Prompt),直接达成“文生视频”;其二,上传图片并配合文字描述,将静态图片转化为动态视频。
此前,视频生成领域的开源SOTA旗舰模型至少有20B,需超过50GB显卡才可部署。HunyuanVideo 1.5的问世大幅降低了硬件部署门槛,能以极低门槛获取旗舰模型体验,目前该模型已上传至Hugging Face和Github社区。
据介绍,HunyuanVideo 1.5模型具备全面且强大的核心能力,支持中英文输入的文生视频与图生视频。该模型还拥有强指令理解与遵循能力,可精准实现多样化场景,涵盖运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,且能在视频中生成中英文文字。在画质方面,模型可原生生成5至10秒时长的480p和720p高清视频,并可借助超分模型提升至1080p电影级画质。
同时,HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention, 选择性滑动分块注意力)在确保高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达商用水平。
HunyuanVideo 1.5 GSB(Good Same Bad)评测结果
腾讯元宝表示,自上线以来,元宝持续拓展AI能力边界,此次“一句话生视频”上线,标志着元宝在多模态能力上迈出关键一步,正式实现从文本、图片、音频到视频的“图文音视”全模态覆盖。这不仅是元宝产品能力的升级,更使AI成为贴近用户的实用工具。
(文章来源:上海证券报·中国证券网)
(文章来源:上海证券报·中国证券网)
原标题:腾讯混元发布并开源HunyuanVideo 1.5 元宝上线生视频能力
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。



