下一代媒体与终端
开源的文字转视频模型:CogVideoX
Speakers
Presentation Slides
Presentation Video
本议题将介绍 CogVideoX,它是一个大型扩散变换器模型,专为根据文本提示生成视频而设计。 结果表明,CogVideoX 在多个机器指标和人工评估方面都表现出了最先进的性能。CogVideoX 的模型权重可通过 https://github.com/THUDM/CogVideo 公开获取。
本议题将介绍 CogVideoX,它是一个大型扩散变换器模型,专为根据文本提示生成视频而设计。 结果表明,CogVideoX 在多个机器指标和人工评估方面都表现出了最先进的性能。CogVideoX 的模型权重可通过 https://github.com/THUDM/CogVideo 公开获取。