
发布日期:2025-07-06 12:02 点击次数:87
IT 之家 3 月 29 日音问第四色婷婷,清华大学东谈主工智能酌量院副院长、生数科技首创东谈主兼首席科学家朱军本日发布了高可控视频大模子 Vidu Q1,官方声称其为业内首个高可控 AI 视频大模子。
IT 之家从官方获悉,Vidu Q1 在多主体细节可控(十分是四肢、布局可控)、音效同步可控、画质增强等方面均得到显赫顺利。以多主体细节可控为例,在语义教唆的基础上,通过融入参考图的视觉教唆,Vidu Q1 相沿对场景中多主体的位置、大小、清醒轨迹等属性进行更进一步的可控,对统共四肢步履(出场、退场、坐立姿态、举止道路)进行精确转化。
淫淫其相沿音效同步可控功能,可确保跟着视频环境与画面转场,Vidu Q1 粗略输出身成相应音效,并可精确限制每段音效的黑白区间,精确确立每段音频出现的时代点第四色婷婷,如 0-2s 风声、3-5s 雨声等。