下一代媒体与终端

OminiX：为不同硬件平台上的生成式 AI 模型迈向统一库和加速框架

Speakers

王言治

Date / Time

2024-10-18

10:10

Presentation Slides

Presentation Video

YouTube

在生成式 AI 时代，一般用户需要应用不同的基础模型、微调检查点和 LoRA。此外，数据隐私和实时性要求将有利于在设备上本地部署大规模生成式 AI 模型。开发一个“即插即用”框架是可取的，这样用户可以下载任何生成式 AI 模型，单击并在自己的设备上运行。这对当前的 AI 部署框架提出了重大挑战，这些框架通常很耗时，并且需要人类对硬件和代码生成的专业知识。我们介绍了 OminiX 的努力，这是朝着统一库和加速跨各种硬件平台的生成式 AI 模型迈出的第一步。结合我们独特的前端库和即将开源的后端即时加速技术，我们展示了即插即用的部署能力和各种生成式人工智能模型的最先进的加速能力，从图像生成、大型语言模型、多模型语言模型、语音生成和语音克隆、实时聊天引擎、实时翻译、视频生成、实时头像等等。这可以在没有服务器的情况下实现，只需在每个人自己的平台上即可。