生数科技下周全球发布Vidu Q1模型,强调高可控
4月16日消息,在今日举办的第三届中国AIGC产业峰会上,生数科技产品副总裁、Vidu产品负责人廖谦透露,下周将全球发布即新的Vidu Q1模型,该大模型优化旨在大幅提升内容创作的可控性,尤其在位置控制、运动布局和音频生成上,以更贴近人类审美和自然法则。
廖谦表示,Vidu Q1模型将推动多模态大模型时代的变革,将极大增强个性化内容生成能力,对社交、游戏、VR/AR等领域产生深远影响。
生数科技(北京生数科技有限公司)成立于2023年3月,是一家专注于多模态生成式大模型与应用产品开发的高科技企业,核心团队来自清华大学人工智能研究院。
生数科技首创了基于Transformer的U-ViT架构,融合了Diffusion模型与Transformer的优势,支持多模态任务的统一建模。该架构在2023年开源的UniDiffuser模型中首次应用,成为全球首个基于Diffusion Transformer的多模态扩散模型,比Stable Diffusion 3采用的DiT架构领先一年。
基于U-ViT架构,生数科技2024年4月发布的视频大模型Vidu可一键生成16秒1080P高清视频,具备多镜头切换、高时空一致性和物理世界模拟能力,性能对标OpenAI的Sora。
本文来源于极客网,原文链接: https://www.fromgeek.com/internet/50-682505.html
本网站的所有内容仅供参考,网站的信息来源包括原创、供稿和第三方自媒体,我们会尽力确保提供的信息准确可靠,但不保证相关资料的准确性或可靠性。在使用这些内容前,请务必进一步核实,并对任何自行决定的行为承担责任。如果有任何单位或个人认为本网站上的网页或链接内容可能侵犯其知识产权或存在不实内容,请及时联系我们沟通相关文章并沟通删除相关内容。
评论