工作坊: Triton 语言与 vLLM
vLLM遇见Qwen:阿里巴巴通义实验室的优化与贡献
Speakers
Presentation Slides
Presentation Video
本次演讲将分享阿里巴巴通义实验室在vLLM 上为 Qwen模型提供高效服务所做的优化工作。这些优化包括模型量化、框架性能增强和算法改进。此外,演讲还将重点介绍团队对 vLLM 开源社区的贡献,并讨论 Qwen 系列模型在未来可能给 vLLM 带来的新的挑战。
本次演讲将分享阿里巴巴通义实验室在vLLM 上为 Qwen模型提供高效服务所做的优化工作。这些优化包括模型量化、框架性能增强和算法改进。此外,演讲还将重点介绍团队对 vLLM 开源社区的贡献,并讨论 Qwen 系列模型在未来可能给 vLLM 带来的新的挑战。