下一代媒体与终端

开源的文字转视频模型:CogVideoX

Speakers
Date / Time
2024-10-17
14:00
Presentation Slides
Presentation Video

本议题将介绍 CogVideoX,它是一个大型扩散变换器模型,专为根据文本提示生成视频而设计。 结果表明,CogVideoX 在多个机器指标和人工评估方面都表现出了最先进的性能。CogVideoX 的模型权重可通过 https://github.com/THUDM/CogVideo 公开获取。