10月 17-18日, 2024

大会日程

参与六大主题分论坛,完整议程、会议时间、主题和发言人即将公布。别错过这些充满活力的会议!(会议信息将持续更新)


Rust 编程语言: 推动安全高效开发的未来

这一议题汇集了 Rust 生态系统的主要贡献者,包括语言本身、编译器、开发工具方面的专家以及技术领导委员会的成员。本主题将从技术和社区两个角度深入探讨 Rust,主要内容包括:

  • Rust 项目的主要贡献者,分享 Rust 生态系统的最新进展和改进情况
  • 真实世界的 Rust 应用程序开发人员,他们将讨论使用 Rust 构建高性能和安全应用程序的经验
  • 学术研究,重点介绍 Rust 的安全保证以及在现代编程中脱颖而出的创新语言特性
  • 项目负责人,他们将概述 Rust 的未来路线图和愿景,分享这种快速发展的语言的下一步发展。

无论您是经验丰富的 Rust 开发人员,还是 Rust 语言的新手,本环节都将为您提供一个独特的机会,与推动 Rust 持续成功和创新的人员进行交流。

别错过这个探索 Rust 未来及其对软件开发影响的机会!

8:30
签到
Time
8:30
Speakers
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Speakers
蒋涛
AGI时代的开源生态
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Speakers
Winner of the GOSIM Hackathon will be announced.
10:10
茶歇 (换场)
Time
10:10
Speakers
20 分钟
10:30
寄存器分配在Cranelift中的作用
Time
10:30
寄存器分配是优化编译器中最关键的阶段之一,通常占用了编译时间的很大一部分。本次演讲将介绍 Cranelift 所使用的寄存器分配器,Cranelift 是一个用 Rust 编写的快速编译后端,并被 Rust 编译器所采用。演讲将重点关注其最新迭代版本 regalloc3,该版本目前正在开发中。
11:10
透过维护者的眼睛: 如何让你的贡献更成功
Time
11:10
Speakers
Ed Page
无论是对Rust项目、你最喜欢的Rust工具,还是你使用的库,第一次贡献可能会让人感到畏惧。进入了一个不了解其社交动态和技术期望的领域。我将从维护者的角度引导你完成贡献的过程,以便你能更好地理解这一流程,并提高你的贡献被接受且迅速采纳的可能性。
11:50
Rust编译器概述
Time
11:50
本讲座将概述Rust编译器:它的外观、工作原理、内部结构以及开发过程。
12:30
午餐
Time
12:30
Speakers
14:00
如何编写你的 Rust 代码检查工具
Time
14:00
本讲座将向你展示如何使用rustc_tools crate(它允许你访问 rust 编译器 API)编写自己的rust linter。如果你的项目需要特定的衬底,但又无法将其添加到clippy 中,那么它将非常有用。本章还将解释编译器API的工作原理,并在最后给出一个小例子来展示其实际应用。
14:40
Rust项目贡献者之路
Time
14:40
Jane Losare-Lusby 将带您回顾她作为 Rust 项目贡献者的经历。从早期在 Clippy 项目上的工作开始,Jane 经历了各种角色,包括错误处理项目组负责人、库和样式团队成员,以及 Rust 基金会董事会成员。在短暂中断 Truffle 和 June 的工作后,她重返 Rust 编译器团队,目前主要负责本地存储度量的开发。 在本讲座中,Jane将分享她在应对冒名顶替综合症、冲突解决、职业倦怠和孤独感等挑战方面的个人见解。Jane 为希望为 Rust 做出贡献的新人提供实用建议,强调导师和联系的重要性、各种Rust团队的动态,以及如何将一个想法(如她目前的度量计划)转化为有意义的贡献。 无论您是经验丰富的开发人员,还是刚刚起步,本讲座都将为您提供宝贵的观点,帮助您找到自己的位置,并在Rust社区中发挥影响。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
炉边谈话
Time
15:50
来自Rust项目语言、库和Cargo团队的Josh Triplett博士进行轻松愉快的采访和问答。
16:30
Rust项目新手指南
Time
16:30
Speakers
Jack Huey
Rust项目在过去几年中无论是成员数量还是结构都得到了显著增长。本次演讲旨在从宏观角度概述构成当今Rust项目的团队和结构,介绍各团队如何沟通和做出协作决策,以及新成员和团体如何参与进来。
17:10
Rust程序的不同链接方式在交易系统中的典型应用
Time
17:10
Speakers
乔丹
本次会议演讲将深入探讨工作区、目标和箱子类型的基本概念。它将展示交易系统中的三个案例,重点介绍使用 -crate-type=lib 进行代码依赖和静态链接、使用 -crate-type=cdylib 进行动态链接以及使用 -crate-type=rlib 进行静态链接。此外,演讲还将扩展讨论重要方面,例如动态链接和静态链接之间的性能差异,以及使用 rlib 时在工具链版本灵活性方面的权衡。

October 18

Rust 编程语言
时间
9:30
Ferrocene - Rust在安全性方面的现状与未来
Time
9:30
Rust 是一门相对较新的语言——2015年发布,却以惊人的速度席卷了软件编程界。 令人惊讶的是,在不到10年的时间里,我们在功能安全/SDV(Software Defined Vehicle,软件定义车辆)领域已经有了持续进行的项目和倡议。Rust甚至被视为开源安全倡议的领跑者。这一切是如何发生的? 本次演讲将提供当前正在进行的倡议概览,评估面临的挑战,并展望未来。
10:10
Rust代码在Linux内核中的差异是什么?
Time
10:10
Speakers
Gary Guo
Linux内核与普通软件项目有很大不同,因此你不应该期望内核Rust代码与你熟悉的Rust代码相似!在本讲座中,我将介绍Linux Rust的基本原语,将它们与用户空间的Rust进行比较,并深入探讨其设计原理。
10:50
茶歇
Time
10:50
Speakers
20 分钟
11:10
低级别编程:Rust教育的“下一件大事”
Time
11:10
Speakers
Bart Massey
Rust社区在Rust入门教学工具方面已经有了一个良好的开端。我将回顾 Rust 教育的现状,尤其是在大学中的情况,并谈谈Rust-Edu和其他团体希望通过哪些方式来满足低级语言领域的新需求。
11:50
构建高效且可扩展的分布式系统:基于Rust的Zenoh以应用于V2V、自主系统及机器人技术
Time
11:50
Speakers
Yuyuan Yuan
在快速发展的V2V通信、自主系统和机器人技术领域,对高效、可扩展的分布式系统的需求至关重要。Zenoh是一种创新协议,它将运动和静止的数据整合在一起,再加上Rust的强大功能,为应对这些挑战提供了令人信服的解决方案。本讲座将探讨如何使用Rust有效地实现Zenoh,从而为边缘计算、物联网和实时应用带来新的可能性。
12:30
午餐
Time
12:30
Speakers
14:00
Rust 操作系统的现状、挑战和关键技术
Time
14:00
Speakers
陈渝
我们分析了基于 Rust 语言的操作系统内核的当前开发状态和面临的挑战。我们还介绍了清华大学操作系统实验室用 Rust 设计和实现的操作系统的开发历史,以及当前在基于组件的操作系统内核方面的工作。讨论还涵盖了在设计和实现组件化操作系统内核时遇到的困难,以及我们正在进行的技术尝试。此外,我们还介绍了我们在中国大学内组织操作系统内核竞赛和举办开源操作系统训练营方面的努力。
14:40
BlueOS中的Rust语言开发实践
Time
14:40
Speakers
陈爽
Vivo BlueOS 使用 Rust 开发,这是一种内存安全的系统编程语言,以其高并发性、强大的安全性和高效而闻名。Rust 为操作系统提供了更稳定、更高效的运行时环境。通过利用 Rust,BlueOS 在处理复杂任务时可以实现更流畅的性能。本演示将演示 BlueOS 如何使用 Rust 语言实现核心系统服务,例如图形和多媒体。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
Rust如何让开源嵌入式驱动变得简单
Time
15:50
在C语言中为你的嵌入式外设添加一个现有的开源驱动程序是非常糟糕的体验。得益于Rust语言本身及其嵌入式生态系统,Rust使得开发开源嵌入式驱动变得轻松。
16:30
在Wasmtime中运用Rust的优势
Time
16:30
Rust编程语言以其安全性保障而闻名,即使在项目被迫使用unsafe代码的情况下,它仍然提供了许多好处。此次演讲将深入探讨Wasmtime项目,这是一个独立的WebAssembly引擎,以及它如何利用Rust的优势来提供关键的安全保障。
18:00
Happy Hour
Time
18:00
Speakers

应用开发专题:跨平台创新的未来

探索最热门的开源框架,深入了解应用开发中的最新技术进步和趋势!在应用开发赛道中,我们将聚焦于:

  • Flutter、React Native、Kotlin Multiplatform、仓颉和 OpenHarmony,探索构建跨平台应用的创新实践
  • WebAssembly 的最新进展,为应用开发提供前所未有的性能和灵活性
  • 基于 Rust 语言的全栈框架,如 Makepad 和 Robius,揭示使用 Rust 作为开发语言的机遇和挑战
  • 生成式人工智能如何彻底改变开发工作流程,提高创造力和效率
  • 来自超级应用开发者的宝贵见解,解锁构建应用未来的关键策略

无论你是经验丰富的开发者还是刚刚起步,这个专题都将提供对前沿技术的深入分析和实用见解,帮助你在快速发展的应用开发世界中保持领先!

不要错过与行业领导者和创新者一起探索应用开发未来的机会!

October 17

App开发
时间
议题
8:30
签到
Time
8:30
Speakers
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Speakers
蒋涛
AGI时代的开源生态
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Speakers
Winner of the GOSIM Hackathon will be announced.
10:10
茶歇 (换场)
Time
10:10
Speakers
20 分钟
10:30
使用Dioxus进行下一代应用程序开发:全栈、跨平台、强类型且快速
Time
10:30
Dioxus 是一个 Rust 框架,它使开发者能够使用单个统一的代码库轻松发布网页、桌面和移动应用。在这次演讲中,我们将介绍一些特性,比如原生移动支持、实时热重载以及自定义的人工智能模型。
11:10
Flutter:谷歌的单代码库UI工具包,适用于移动、Web和桌面应用
Time
11:10
Speakers
Kevin Moore
Flutter是一个开源框架,允许开发者从单一代码库构建美丽且原生编译的多平台应用程序。
11:50
Blitz:模糊 Web 与原生之间的界限
Time
11:50
Speakers
Nico Burns
介绍 Blitz,一种新的跨平台应用程序运行时,它结合了与 Web 兼容的“一次编写、随处运行”的 UI 代码,在部署到本机(非 Web)平台时具有较小的占用空间和强大的系统集成。
12:30
午餐
Time
12:30
Speakers
14:00
uni-app x:新一代、纯原生跨平台框架
Time
14:00
Speakers
崔红保
近些年,跨平台开发早已是大家熟知的一种开发范式,但跨平台开发依然常被开发者诟病?原因何在?如何改进解决?\r\n本次演讲,我将分享uni-app团队对此问题的思考和探索,对原生、H5、小程序三个平台,分别阐述其性能堵点及优化实践,并将介绍 uni-app x 这个新的跨平台框架。uni-app x采用类TS的DSL,通过Rust编译成swift/Kotlin/arkTS,获得纯正原生App,在彻底解决传统Hybrid App性能顽疾的前提下,借助web生态,解放生产力,快速交付。
14:40
针对Rust的增量链接和热代码重载
Time
14:40
编辑-构建-运行的开发周期缓慢是 Rust 开发人员普遍抱怨的问题。Wild 项目旨在通过构建 Rust 的链接器来解决这一问题,其目标是最终支持增量链接和热代码重载。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
将Servo应用到OpenHarmony
Time
15:50
将用Rust编写的网络渲染引擎servo移植到OpenHarmony的最新进展。
16:30
GenUI:基于 Makepad 的声明式 Rust 跨平台框架
Time
16:30
Speakers
盛逸飞
GenUI 是一个新的 Rust 语言开发的创新 SFP 前端框架。它最初的灵感来自 Vue3 和 Makepad。它在帮助助用户有效使用Rust编程编写前端项目。

October 18

App开发
Time
Session
9:30
Makepad:Rust 中的可视化应用程序设计
Time
9:30
Speakers
Rik Arends
在本次演讲中,我将展示全新的、采用 MIT 许可证的可视化应用程序 IDE 和设计工具 Makepad Studio。我们将探讨基于本地模型的 AI 辅助编程,并抢先预览我们的可视化 UI 设计器。Makepad 是一个针对 Rust 的 UI 框架和 IDE/设计工具的组合。Makepad 利用 GPU 加速的技术栈,能够在 Web、Android、iOS、macOS、Linux 和 Windows 上原生运行。专注于保持轻量化,完整的应用程序在现代计算机上包含所有依赖项的情况下仍可在 10 秒内完成编译。
10:10
跨平台开发新选择:以 Kotlin Multiplatform 打造多平台应用
Time
10:10
Speakers
范圣佑
Kotlin Multiplatform 已逐渐成为跨平台开发的强大工具,开发者能用一个编程语言,开发支持移动端、桌面端、前端到服务端的多平台应用。本次分享中,将介绍 Kotlin 多平台的核心理念,演示其架构设计和开发流程中的实际应用,并介绍相关工具与生态,以及 Kotlin 学习资源及社区动态。通过本次演讲,将能了解 Kotlin Multiplatform 为何是跨平台开发的好选择及其潜力。
10:50
茶歇
Time
10:50
Speakers
20 分钟
11:10
用React Native征服多平台
React Native 已经超越了iOS和Android,开始支持更多平台,如Microsoft Windows和华为的OpenHarmony。让我们深入探讨React Native开源社区的努力,看看他们是如何实现的。
11:50
Quake: 桥接构建系统鸿沟
Time
11:50
软件复杂性的增长速度已经超出了许多支持它的构建系统的能力范围。现代应用程序需要构建时功能,例如资产处理和跨平台、多语言编译,但用于这些任务的工具很少能适应如此广泛的范围。Quake 提供了一个与任何技术堆栈兼容的富有表现力的跨平台构建系统,从而正面解决了这个问题。我们还将探索其他流行的构建系统和技术,以及它们面临的挑战,以更好地了解我们当前的状况以及未来可能的发展方向。
12:30
午餐
Time
12:30
Speakers
14:00
全新跨平台解决方案:ArkUI-X
Time
14:00
Speakers
晏国淇
介绍基于鸿蒙原生范式的新一代跨平台框架ArkUI-X,基于ArkUI-X可以将鸿蒙原生应用快速部署至Android、iOS,实现一次开发多平台复用
14:40
基于Rust的原生HarmonyOS应用开发 + OHOS上的Makepad
Time
14:40
两个简短的演讲: 1. Rust在原生HarmonyOS应用开发中的适配及使用经验分享。 2. OpenHarmony提供了XComonent组件用于图形绘制和媒体数据写入、同时也提供了界面操作相关事件的回调函数。使用这两项能力,可以将Makepad中生成的EGL指令输出到XComonent中完成图形的显示,同时通过注册XComonent操作事件回调函数,将屏幕操作事件以及屏幕坐标转换为Makepad内部事件和坐标。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
用Rust中的增量解析器进行结构化文本生成
Time
15:50
Speakers
Evan Almloff
大型语言模型(LLMs)是理解非结构化数据的强大工具。我们将探讨 Kalosm 如何利用 Rust 实现高性能的结构化生成,从模型输出中提取结构化数据。在此过程中,我们还将深入了解 LLM 的内部结构以及高性能增量解析器。
16:30
Masonry:Rust 中的命令式控件工具包
Time
16:30
Speakers
Daniel McNab
通过将状态管理与底层行为脱钩,Masonry 可以开发高性能 GUI 框架。它的开放式控件集提供了比 Web DOM 更大的灵活性。 这将是一场带有远程问答的视频录制讲话。
18:00
Happy Hour
Time
18:00
Speakers

AI 模型与基础设施专题:开拓下一代人工智能

在人工智能模型与基础架构专题中,我们汇集了来自全球最具影响力的开源人工智能项目的专家。本主题涵盖塑造人工智能未来的关键主题,包括:

  • AI基础模型及其在构建先进智能系统中的作用
  • 直接在边缘设备上提供AI解决方案的设备上模型
  • 完全开源的模型,实现AI开发的透明、协作和创新
  • 支持尖端AI进步的大规模AI训练框架
  • 边缘推理框架,将AI能力推向边缘,实现实时解决方案
  • 代理框架,推进AI的自主和决策能力
  • 微调技术,为特定应用定制模型
  • 垂直领域的AI应用,展示AI如何改变各行各业

本专题深入探讨了推动AI发展的创新技术,并从塑造未来智能系统的领导者那里获得了宝贵的见解。

不要错过这个学习最新开源项目、探索人工智能发展未来的机会!

October 17

AI 模型与基础设施
Time
议题
8:30
签到
Time
8:30
Speakers
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Speakers
蒋涛
AGI时代的开源生态
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Speakers
Winner of the GOSIM Hackathon will be announced.
10:10
茶歇 (换场)
Time
10:10
Speakers
20 分钟
10:30
OPEN-SORA:高效低成本视频生成模型
Time
10:30
Speakers
尤洋
Open-Sora项目是全球首个类Sora开源复现方案,它创造了一个高效低成本的视频生成模型。本次演讲将从Open-Sora的核心理念出发,详细解析其独特的模型架构,展现这一架构对视频生成效率的优化和对成本的显著降低。演讲还会讨论Open-Sora如何在保持高质量输出的同时,实现对不同视频分辨率和长度的适应性,以及如何克服此类大模型训练中常遇到的数据存储问题,并在推理成本和内存使用两方面进行深入优化。Open-Sora模型以其趣味性和高质量在开源社区内反响热烈,本次演讲,我们还将展现这些开源社区的内的创作,和您一起探索视频生成领域的前沿技术。
11:10
FlagOpen中Aquila系列中英双语大模型的构建与开源
Time
11:10
Speakers
王良栋
北京智源人工智能研究院自成立以来一直致力于开源开放,FlagOpen开源体系覆盖大模型的多个方面。本次主要围绕Aquila系列中英双语大模型介绍智源在自然语言大模型的研发工作和开源项目,具体包括算法方案、预训练与对齐算法框架、预训练与对齐数据集构建与开源。
11:50
书生浦语大模型开源开放体系
Time
11:50
Speakers
高剑飞
InternLM 由上海人工智能实验室开发。我们保留开源的高质量 LLM 以及用于开发和应用的全栈工具链。在本次演讲中,我们将分享InternLM及其相关工具链的最新发展,涵盖代理、评估和人工智能基础设施等领域。
12:30
午餐
Time
12:30
Speakers
14:00
使用完全开源的Moxin 7B模型揭开LLM训练的神秘面纱
Time
14:00
Speakers
王言治
最近,大型语言模型(LLM)经历了重大转变,其受欢迎程度和功能均迅速上升。开源 LLM,例如 LLaMa 和 Mistral,由于易于在各种应用程序中自定义和部署模型,为 LLM 的日益普及做出了巨大贡献。尽管LLM为研究和创新提供了前所未有的机会,但其商业化引起了人们对透明度、可重复性和安全性的担忧。许多开放的LLM模型缺乏必要的组件(例如训练代码和数据),以实现充分理解和可重复性,有些则使用限制性许可证,同时声称是 “开源”,这可能会阻碍LLM的进一步创新。为了缓解这个问题,我们遵循模型开放性框架 (MOF),这是一个排名分类系统,它遵循开放科学、开源、开放数据和开放获取的原则,根据机器学习模型的完整性和开放性对其进行评级。我们提供了一个真正的开源 LLM Moxin 7B,并发布预训练代码和配置、训练和微调数据以及中间和最终检查点,旨在对完全开源 LLM 做出持续承诺。
14:40
迈向实用化多模态大模型
Time
14:40
Speakers
余天予
多模态大模型作为迈向通用人工智能的必由之路,展现了智能跃迁的巨大潜力。它不仅是学术探索的前沿,更是构建人类命运共同体,促进全球合作的催化剂。高昂的部署推理成本、频繁的幻觉行为、稀缺的高质量数据都极大制约了多模态大模型的发展,MiniCPM-V 从这些关键问题入手,首次实现了和闭源商用多模态大模型可比的端侧多模态理解能力。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
CodeGeeX4:应用于人工智能编程的多功能代码生成模型
Time
15:50
Speakers
郑勤锴
我们介绍最新 CodeGeeX4 模型系列的开源版本 CodeGeeX4-ALL-9B。它是在 GLM-4-9B 基础上持续训练的多语言代码生成模型,大大增强了代码生成能力。使用单个 CodeGeeX4-ALL-9B 模型,可支持代码自动补全与生成、代码解释器、网页搜索、函数调用、版本库级代码问答等综合功能,覆盖软件开发的各种场景。CodeGeeX4-ALL-9B 在 BigCodeBench 和 NaturalCodeBench 等公开基准测试中取得了极具竞争力的性能。它是目前参数小于 10B 的最强大代码生成模型,甚至超过了更大的通用模型,在推理速度和模型性能方面实现了最佳平衡。
16:30
Functionary: 利用工具与大型语言模型协同工作
Time
16:30
Functionary是一个开源的大型语言模型(LLM),能够在保持对话能力的同时使用工具。我们将讨论如何通过函数调用来实现复杂的代理任务,以及我们如何解决函数调用过程中遇到的挑战。
17:10
元象大模型的实践探索
Time
17:10
Speakers
轩文烽
主要介绍元象大模型在从0到1,从Dense到MoE的研发过程中的实践探索,包括数据、模型、架构等方面。数据层面,大模型需要哪些数据,怎么加工处理,怎么迭代更新;模型层面,从Dense到MoE,如何设定专家大小、专家权重;架构层面,如何提升训练效率,如何保证稳定训练等。

October 18

AI 模型与基础设施
Time
Session
9:30
vLLM:简单、快速且低成本的LLM服务解决方案
Time
9:30
Speakers
游凯超
vLLM是一个快速易用的LLM推理和服务库。在本讲座中,我将简要介绍vLLM项目的发展历程、其背后的开源社区,并重点介绍许多用户感兴趣的一些功能。
10:10
OpenMind 应用程序支持套件为Ascend 开发带来了全新的训练和推理体验
Time
10:10
Speakers
马勇强
Ascend 的持续发展离不开开源社区的合作。作为 Ascend 的生态窗口,OpenMind 工具套件专注于为开发人员提供从模型分发到集成模型训练和推理的轻量级功能,从而降低 NPU 的开发门槛。本次分享将为观众提供与 OpenMind 相关的专有功能,包括提高融合运算符的效率和容器的自适应版本管理、包括 Llama-Factory 在内的开源社区中第三方库的适配能力,以及与 Magic Leap 社区合作的进展。
10:50
茶歇
Time
10:50
Speakers
20 分钟
11:10
百变大模型高效训练框架LLaMA Factory
Time
11:10
Speakers
郑耀威
LLaMA Factory是一个高效、易用、可扩展的开源大模型高效训练框架,在GitHub开源社区获得超过 3 万 Stars,得到多家国内外企业的关注或落地应用。本次分享将从大模型高效训练的角度详细剖析 LLaMA Factory 的构建动机与组成模块,包括上百种大模型的全栈微调适配原理,LoRA 算子优化加速方法,多种微调 Trick 集成思路等等。
11:50
基于XLang构建xMind AgentFlow框架:打造MoFA平台的底层逻辑
Time
11:50
Speakers
本次演讲将介绍MoFA平台及其底层框架 xMind — AgentFlow,这是一个基于XLang 构建的模块化AI代理框架,专为实现 LLM 的记忆、规划和代理管理而设计。通过会话记忆和灵活的数据流图,AgentFlow提供高效的多会话管理,以及复杂任务的分解与优化,为开发者打造可组合的AI操作系统提供了强大支持。
12:30
AutoGen:以多智能体对话推动下一代LLM应用实现
Time
12:30
Speakers
吴清云
AutoGen是一个用于具身人工智能的开源编程框架。它使得开发大型语言模型(LLM)应用成为可能,这些应用使用多个可以相互交谈以解决问题的智能体。在本次演讲中,演讲者将介绍AutoGen,并分享最新的更新和正在进行的研究工作,涵盖评估、接口、学习/优化/教学以及与现有 AI 技术无缝集成等关键方向。演讲者还将深入探讨围绕AutoGen的开放性问题和未来计划。(这将是一次预先录制的演讲)
12:30
午餐
Time
12:30
Speakers
14:00
驾驭开源AI治理:模型开放框架与欧盟AI法案
Time
14:00
探索模型开放框架(MOF)及其在开源AI治理中的作用。了解MOF如何指导遵守新的法规,如AI法案,解决关于组件发布和开源AI系统中适当许可的关键问题。通过本演讲,您将了解到MOF如何帮助组织和开发者在确保技术创新的同时,满足法律要求,促进负责任的AI发展。
14:40
AI Hub:面向中国开发者的下一代开源模型社区
Time
14:40
Speakers
崔志康
AI Hub:为中国的开发者构建一站式 AI 生态系统,助力快速创新
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
XLang™:开启全新篇章
Time
15:50
Speakers
李龙江
XLang™ 是一种为人工智能和物联网应用设计的下一代编程语言,旨在提供动态、高性能的计算能力。它在分布式计算方面表现出色,并且可以与C++、Python和JavaScript等流行语言无缝集成,使其成为跨多种操作系统的通用选择。
16:30
基于LLM的AI应用工作流编排系统
Time
16:30
大型语言模型(LLMs)的快速发展催生了多种架构和框架,每种都引入了独特的AI工作负载和工作流。然而,高效编排、工作负载重用以及降低基于LLM的应用部署障碍等挑战仍然是企业面临的关键障碍。本议题将探讨英特尔的开源项目OPEA(企业AI开放平台)如何应对这些挑战。重点将放在GMC(GenAI微服务连接器)上,这是一种旨在优化AI工作负载的动态编排工具。
18:00
Happy Hour
Time
18:00
Speakers

具身人工智能专题:开创智能机器人的未来

具身人工智能专题汇聚了机器人技术和人工智能领域的最新突破,深入探讨塑造智能机器未来的前沿技术,关键主题包括:

  • 开源机器人操作系统的进展、先进的数据收集机制以及对开发更智能、更强大机器人至关重要的创新模型训练框架
  • 下一代机器人数据集,融合物理和合成数据以构建机器人基础模型,使通用机器人能够执行工业任务和家务劳动
  • 探索开源计算机视觉项目(如 OpenCV)以及最新的开源视觉语言模型,为机器人的空间智能开辟新途径
  • 开源仿人机器人的演变以及机械臂生态系统的进步,展示了多功能、协作式机器人系统的未来

参与这些议题,探索开源创新如何推动机器人能力的下一波浪潮,让我们更接近一个智能机器人无缝融入工业和日常生活的未来。

October 17

具身智能
Time
议题
8:30
签到
Time
8:30
Speakers
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Speakers
蒋涛
AGI时代的开源生态
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Speakers
Winner of the GOSIM Hackathon will be announced.
10:10
茶歇 (换场)
Time
10:10
Speakers
20 分钟
10:30
OpenCV和空间智能
Time
10:30
Speakers
Gary Bradski
我将介绍即将发布的 OpenCV 版本以及目前在 “空间智能”(人工智能 + 空间中的 3D 姿态)方面的举措
11:10
Eclipse Zenoh:面向普遍与异构AI场景的通信骨干网
Time
11:10
人工智能已变得无处不在,用新技术增强了我们的许多互动。这种无所不在的现象需要一个强大的通信骨干网,使数据能够无缝流动。本讲座将详细介绍下一代通信中间件Eclipse Zenoh。
11:50
开源模拟在具身智能时代的作用
Time
11:50
在 “具身人工智能 ”时代,开源仿真平台在推动创新与合作方面发挥着举足轻重的作用。本讲座探讨了开放性与封闭性软件/API之间的平衡,强调了在开发强大的嵌入式人工智能仿真工具时对灵活性和可扩展性的需求。通过将 CARLA 作为一个案例进行研究,我将重点介绍开源计划如何促进社区参与、加速研究以及提供满足不同研究需求的适应性工具。
12:30
午餐
Time
12:30
Speakers
14:00
基于OpenHarmony的开源机器人操作系统
Time
14:00
Speakers
巴延兴
技术进步、人口老龄化等众多因素正在推动机器人产业的蓬勃发展,而目前市面上还没一款正式的完全面向机器人的操作系统。OpenHarmony是一款面向全场景、全连接、全智能时代的智能终端设备操作系统,它基于软总线的分布式能力等技术特性和机器人对OS的诉求高度契合。深开鸿联合多家头部企业和高校在OpenHarmony技术指导委员的指引下在开源社区推出了基于OpenHarmony的机器人操作系统开源版,本议题将围绕这款OS的系统架构、技术特点、行业应用等方面展开介绍。
14:40
功能型无人车任务建模方法
Time
14:40
Speakers
岑明
作为执行配送、销售、穿梭、安全巡逻等智能任务的载体,功能型无人车可以说是体现智能的典型代表。考虑到智能任务的多样性,设计一套通用的任务建模和执行方法对于实现功能型无人车的快速开发和部署具有重要意义。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
面向工业领域大模型驱动的机器人技术
Time
15:50
Speakers
杨磊
在工业领域,对数据驱动的机器人技术的需求不断增长。其技术路径包括先进的传感器技术、机器学习算法和实时数据处理。然而,我们也面临着诸如数据安全和系统互操作性等挑战。
16:30
具身智能行动学习所需的数据要素有哪些?
Time
16:30
Speakers
黄浴
大规模语言模型(LLM)出现之后,具身人工智能(Embodied AI)的发展被视为实现通用人工智能(AGI)的基本路径。然而,与LLM相比,数据目前是具身AI进步的关键瓶颈。在本次演讲中,首先分析了学习策略,特别是针对具身操作的学习策略。同时,调查了现有具身AI领域的多种公开数据集。最终,总结出了一个必要的具身AI数据集的要求,并介绍了一个即将推出的由虚幻引擎5渲染的合成视频数据集,名为MVGameIR。
17:10
开放世界的具身大模型
Time
17:10
Speakers
Jiaming Liu
多模态大语言模型(MLLMs)已在各种任务中展示了在视觉指令跟随方面的潜力。最近,一些研究将 MLLMs 集成到机器人操作中,使机器人能够解释多模态信息并预测低级动作。尽管基于 MLLM 的策略已经显示出令人鼓舞的进展,但在面对新任务或类别时,它们可能会预测出失败的执行姿势。鉴于这些挑战,我们提出一个问题:“我们能否开发一种端到端的机器人代理,不仅具备操作技能,还能有效纠正低级失败动作?” 借鉴丹尼尔·卡内曼的观点,即“人类思维分为快速系统和慢速系统,分别代表直觉过程和更为逻辑的推理”,我们介绍了一系列模仿人类思维方式的研究工作,以解决上述问题。

October 18

具身智能
Time
Session
9:30
AIRSHIP: 以具身智能赋能智能机器人
Time
9:30
Speakers
刘少山
AIRSHIP的开发旨在解决具身AI中的软件复杂性问题。其使命是提供一个易于部署的软件栈,赋能各种智能机器人,从而促进可扩展性并加速具身AI行业的商业化。AIRSHIP受到Android的启发,Android通过提供一个开源灵活的平台在移动计算革命中发挥了重要作用。Android使得多种设备制造商能够以不同价格点创造智能手机和平板电脑,催生了快速的创新和竞争,致使经济实惠且强大的移动设备的广泛普及。Android强大的生态系统,通过Google Play商店支持大量应用程序,允许开发者触及全球受众,显著推动了移动技术的采用。类似于Android,AIRSHIP提供软件和硬件规格,使机器人开发者能够为家庭、零售和仓储等多种场景开发完整的具身AI系统。
10:10
用动作捕捉技术构建具身智能数据工厂
Time
10:10
Speakers
戴若犁
分享将从动作捕捉技术与具身智能机器人领域的关系切入,介绍应用于具身智能机器人领域的诺亦腾动作捕捉解决方案的工作流程,强调人体与机器人本体之间的映射在整体工作流程之中的重要性与挑战性;阐释四种主流机器人数据集生产方式的差异,并最终通过介绍诺亦腾与行业内合作伙伴的落地案例,再次强调建立大规模具身智能数据工厂(DataFactory)的重要性与可行性。
10:50
茶歇
Time
10:50
Speakers
20 分钟
11:10
用dora-rs超简易调整机械臂AI模型
Time
11:10
Speakers
陶海轩
让机器人自主工作变得越来越容易。我们将了解如何通过几个步骤就能开始训练一个能自动执行任务的模型。要归功于dora-rs,它让人工智能模型的微调变得超级简单。
11:50
Rapier:向分布式物理仿真更进一步
Time
11:50
Rapier是专为Rust设计的强大开源物理引擎。在本讲座中,将介绍我们在分布式物理仿真方面的最新研究成果,以及如何利用物理引擎特有的功能来提高其性能。
12:30
午餐
Time
12:30
Speakers
14:00
具身协同导航与交互学习
Time
14:00
Speakers
刘华平
当前,复杂高动态环境对机器人的感知与学习提出了更加迫切的需求。集群系统为多机器人协同应用带来了效能倍增与应用突破,同时也对群体智能的感知、学习的理论研究与工程应用带来了巨大的挑战。本报告面向态势理解在适应异构机器人平台感知、动作的能力差异,以及适应广域动态场景高效、鲁棒的感知这两大类多机器人协同任务需求,针对如何利用异构多机器人的感知与学习能力实现集群增效与行为涌现,介绍相关的研究进展。
14:40
OpenCSG具身智能数据平台
Time
14:40
Speakers
曹东
OpenCSG推出了一款强大的具身智能数据平台产品:CSG DataFlow,旨在为数据科学家和开发者提供高效全面的具身智能应用场景数据集处理解决方案。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
OpenLoong社区:构建开放、协作的人形机器人开源生态
Time
15:50
Speakers
田翀
本演讲将深入探讨OpenLoong社区的成立、发展、成就以及未来展望。作为国内领先的人形机器人开源社区,OpenLoong致力于推动人形机器人具身智能技术的发展,促进开发者之间的交流与合作。演讲将分享社区的成功案例、面临的挑战以及如何通过开放协作构建一个更加繁荣的人形机器人开源生态系统。
16:30
打破边界——探索机器人终局
Time
16:30
Speakers
张旭龙
打破边界——探索机器人终局
18:00
Happy Hour
Time
18:00
Speakers

下一代互联网:构建明日的Web

下一代互联网正在重塑我们对网络应用、身份和全球协作的认知。这个专题将探索:

  • 像消息传递和社交网络这样的去中心化应用,增强了个人控制和隐私,通过具有改进的数据保护的去中心化人工智能社区赋予用户权力
  • 为最佳性能、安全性和可嵌入性而设计的开源浏览器,引领基于浏览器的应用程序(包括小程序)的未来
  • TSP和GAN标准,在互联网范围内为下一代信任设计奠定基础
  • 开源实现去中心化协议和应用的的关键作用,这对于将新的互联网标准变为现实至关重要

这个些议题强调了推动互联网未来的关键创新,以及这些技术如何为所有人培育一个更安全、去中心化和协作的网络。

October 17

Next Generation Internet
Time
议题
8:30
签到
Time
8:30
Speakers
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Speakers
蒋涛
AGI时代的开源生态
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Speakers
Winner of the GOSIM Hackathon will be announced.
10:10
茶歇 (换场)
Time
10:10
Speakers
20 分钟
10:30
去中心化技术和下一代平台
Time
10:30
Speakers
Alan Majer
数字体验在很大程度上以集中式平台为媒介。这些占主导地位的平台面临着去中心化构件、人工智能和算法的颠覆——这为我们在开放的基础上重建平台、夺回数据和体验的控制权提供了新的机遇。本演讲将分享对 23 位致力于开放未来的人士进行研究访谈后得出的见解。
11:10
建设以用户为中心的互联网
Time
11:10
Speakers
赵睿
互联网越来越多地集中在少数几个大平台上,导致了许多忽视或损害用户利益的问题。近年来,人们更加关注以用户为中心的去中心化架构。在本讲座中,我将简要回顾不同的思路,并重点介绍网络发明人蒂姆-伯纳斯-李提出的一种方法--Solid(社会关联数据),以重新分散网络。我将介绍它的主要原则、目前提供的内容,以及(我们团队)为扩展其边界所做的探索。最后,我将提出对 “稳固 ”的展望和相应的开放性问题,以激励未来的发展。
11:50
Palpo社交服务器:支持 Matrix 协议的自托管社交服务器
Time
11:50
Speakers
杨学成
Rust实现的个人云部署的开源的Matrix服务器
12:30
午餐
Time
12:30
Speakers
14:00
从区块链到Web3:构建去中心化网络
Time
14:00
Speakers
黄华威
可扩展性已成为区块链底层的一个关键研究方向。学术界提出了多种代表性解决方案以改善区块链的可扩展性,如有向无环图技术、分片技术、新共识机制、状态通道、侧链和跨链等。其中,分片技术被认为是一种具有巨大潜力的第一级扩展解决方案,可以显著提高区块链的可扩展性。本文首先整理了区块链分片技术的研究现状,然后介绍了黄教授研究团队基于分片区块链构建的新DeFi协议——BrokerFi。
14:40
Robrix:纯Rust实现的Matrix客户端及其功能
Time
14:40
Speakers
Kevin Boos
Robrix是一个新的Marix客户端,在成为联邦服务的中心枢纽中央。通过基于 Robius 应用开发框架构和 Makepad 用户界面工具包构建,Robrix 能在多个平台和设备上无缝运行,无需编写 PruncTSeap 的代码。这不仅仅是提高了开发效率,还提供了用户在不同设备间获得一致的使用体验。Robrix 的设计理念是促进开放通信,同时提供高度可定制的界面和强大的功能集,以满足不同用户群体的需求需求。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
Moxin 增加大模型去中心化的分发能力
Time
15:50
Speakers
蔡书
随着人工智能的发展,大型语言模型(LLM)在各个行业的应用日益广泛,但模型文件的集中化分发方式仍面临着基础设施成本高、访问受限等问题。Moxin 通过去中心化的分发模型文件的方式,专注于模型文件的高效、安全传输,旨在解决这些挑战。
16:30
压缩无处不在:Rust中的即插即用式压缩
Time
16:30
在网络上加载几乎所有内容时都会用到数据压缩。本讲座将介绍我们如何在 rust 中实现 zlib-rs 和其他压缩算法,使其与C语言的相应算法兼容。

October 18

Next Generation Internet
Time
Session
9:30
The Global Acceptance Network: :大规模实施去中心化数字信任基础设施
Time
9:30
The Global Acceptance Network(GAN)是互联网数字公共基础设施的新一层,某种程度上类似于目前互联网的域名系统(DNS)。GAN将使个人、组织和“事物”(如设备、软件、AI机器人)能够使用开放标准的数字钱包、数字凭证和信任注册表来建立和维护可持续的数字信任关系。这一新设施旨在解决互联网当前存在的诸多问题,包括垃圾邮件、网络钓鱼、欺诈、恶意软件、勒索软件以及其他长期存在的安全、隐私和信任问题,这些问题之所以出现是因为互联网最初的设计中并未包含信任层。通过引入GAN,旨在为用户提供更加安全、可信的网络环境,促进数字经济和社会的健康发展。
10:10
信任跨越协议及其在实现真实AI中的作用
Time
10:10
Speakers
Wenjing Chu
缺乏真实性问题是当今互联网的一大顽疾。试想一个充斥着我们无法信任、更不用说控制的AGI代理的世界!现在是时候为AI和互联网的未来奠定坚实的信任基础了。没有一个能够让人们、组织和社会在技术和人性层面建立信任与控制的框架,AI的广泛应用将无从谈起。在本次演讲中,本议题将介绍围绕信任跨越协议(TSP)的前沿信息真实性技术,以及它在内容生成、推理和自主代理等领域实现真实AI方面所起的关键作用。
10:50
茶歇
Time
10:50
Speakers
20 分钟
11:10
Wasm 作为 API 优先和代理互联网的通用运行时
Time
11:10
Speakers
Michael Yuan
Wasm 已成为一种跨平台、硬件可移植且与语言无关的通用运行时环境。它可以作为小部件或扩展嵌入到许多不同类型的应用程序或 SaaS 中。在本次演讲中,我们将讨论 Wasm 在编程下一代互联网方面的常见用例,包括无服务器功能、工作流程自动化、web3 智能合约到 AI 代理。
11:50
WebAssembly 组件是什么及为何使用
Time
11:50
WebAssembly 组件,作为 WebAssembly 组件模型提案的一部分,承诺提供一个既能在浏览器内也能在浏览器外开发可移植和可组合应用程序的框架。组件保留了 WebAssembly 最优秀的特性,如其可移植性、安全性和性能,同时还将高级 API 设计和组合性的优势带给了应用程序。来了解组件模型以及它可能为您带来的好处吧!
12:30
午餐
Time
12:30
Speakers
14:00
开源教育在下一代互联网(NGI)中的作用
Time
14:00
Speakers
张国锋
经管法高校开源人才培养
14:40
浏览器的定制与思考
Time
14:40
Speakers
王斌
探索构建小巧的浏览器内核
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
使用(非)形式化方法在Servo中解决并发问题
Time
15:50
Servo 是一个Web引擎,其中一个目标是实现并行处理,这带来了与并发相关的一系列挑战,而这些挑战是Rust编译器本身无法完全覆盖的。TLA+ 是一种用于建模并发算法的数学语言,使其成为提高Servo正确性的有力工具。在本次演讲中,我们将讨论最近的实际应用案例,展示TLA+如何帮助解决Servo中的并发问题,提升系统的稳定性和性能。通过这些案例,听众将了解到如何利用形式化方法在复杂的软件项目中确保逻辑的正确性。
16:30
告别WebSockets和WebRTC!使用 Rust、QUIC、WebTransport 和 HTTP/3 提升网络通信
Time
16:30
In this talk, we'll explore the future of real-time web communication by moving beyond WebSockets and WebRTC. Learn how Rust, QUIC, WebTransport, and HTTP/3 offer enhanced security, scalability, and performance. Using a videoconferencing system as a case study, we’ll demonstrate how these technologies can revolutionize modern web communication.
18:00
Happy Hour
Time
18:00
Speakers

下一代媒体与终端:革新视觉和互动体验

下一代媒体主题将深入探讨改变我们创建数字内容并与之互动的前沿技术。主要议题包括:

  • WebGPU 标准及其开源实现,这是一种用于图形、物理模拟和生成式人工智能应用的开创性统一计算内核;
  • 用于生成高质量图像、视频和三维内容的最新开源生成式人工智能模型和工具,为创造性表达提供新的可能性;
  • 新兴的生成式媒体应用,展示人工智能驱动的内容创作如何重新定义娱乐、设计和营销等行业。
  • 下一波人工智能驱动的 XR 和可穿戴设备,通过结合身临其境的体验与智能技术,彻底改变消费设备的格局。

与我们一起探索媒体创作、互动体验的未来,塑造下一代数字内容的技术。

October 17

Next Generation Media & Device
Time
议题
8:30
签到
Time
8:30
Speakers
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Speakers
蒋涛
AGI时代的开源生态
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Speakers
Winner of the GOSIM Hackathon will be announced.
10:10
茶歇 (换场)
Time
10:10
Speakers
20 分钟
10:30
WGPU:Rust中的现代GPU编程
Time
10:30
Speakers
Jim Blandy
GPU拥有卓越的性能——前提是你的问题能够适应其计算模型。超线程、局部内存空间、强制矢量化以及其他一些特性都会影响GPU代码的编写方式。WGPU 是一个跨平台的GPU编程API。
11:10
Khronos Vulkan标准最新进展介绍
Time
11:10
Speakers
蔡康颖
介绍Khronos Vulkan标准,标准最新进展,和一些新Vulkan feature。
11:50
WGMath:用于跨平台 GPU 科学计算的可重复使用 WebGPU 着色器
Time
11:50
使用 WebGPU,WGMath 旨在通过为所有科学界提供可重复使用的 WGSL 着色器来将 GPU 科学计算引入所有平台。我们将讨论这个生态系统的基础知识、LLM、几何学和物理学的当前和未来特征。
12:30
午餐
Time
12:30
Speakers
14:00
开源的文字转视频模型:CogVideoX
Time
14:00
Speakers
张昱轩
本议题将介绍 CogVideoX,它是一个大型扩散变换器模型,专为根据文本提示生成视频而设计。 结果表明,CogVideoX 在多个机器指标和人工评估方面都表现出了最先进的性能。CogVideoX 的模型权重可通过 https://github.com/THUDM/CogVideo 公开获取。
14:40
Open-Sora Plan: 基于国产算力的视频生成大模型开源计划
Time
14:40
Speakers
程鑫华
Open-Sora Plan是支持全程在昇腾算力上进行计算的国产视频生成大模型开源计划。本次演讲介绍Open-Sora Plan的进展,细节和规划。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
FaceChain在数字人领域的发展与演进
Time
15:50
Speakers
孙佰贵
FaceChain,是一个在人脸感知理解、数字写真、说话视频生成等方面都有创新的数字人开源项目,正在引领数字人领域的新浪潮。用户仅需一张照片,即可创建个性化的数字形象,并利用多样化的风格和模版库生成独特的写真作品。FaceChain提供了全栈的数字写真生成功能,即包含保10s免训练数字写真生成功能,也包含DIY风格模型快速训练功能,目前正在构建数字写真内容生态中。除此之外,FaceChain在生成说话视频和虚拟试衣上也有相应布局与产出。FaceChain以其开源精神和社区活力,推动了技术的快速发展和广泛应用。本议题将深入探讨FaceChain的技术特点、社区建设、商业应用前景以及其在数字人领域的演进路径。
16:30
Pointrix:一个可微分的基于点的渲染库
Time
16:30
Speakers
陈林卓
在过去的一年中,以三维高斯溅射为代表的可微分点云渲染技术取得了重大进展。本报告将介绍 Pointrix,这是我们的研究小组开发的可微分点云渲染优化框架。Pointrix 由模块化的 Python API、高效的 CUDA 后端和用户友好的实时渲染 GUI 界面组成,使其成为易于扩展的开源点云渲染框架。Pointrix 提供详细的快速入门指南和丰富的示例配置,允许用户通过在 Python 级别进行更改来实现特定的算法。它为研究人员提供了可移植的二次开发环境。此外,Pointrix 支持一系列与 3DGS 相关的主流工作,为可微分点云渲染领域的研究和应用提供强有力的支持。

October 18

Next Generation Media & Device
Time
Session
9:30
元宇宙标准论坛概览
Time
9:30
Speakers
Dennis Fu
元宇宙标准论坛是全球最重要的也是最大的专注于元宇宙标准制定的产业联盟之一。该组织致力于开放的元宇宙发展。本概览将为观众提供有关其历史和愿景的信息,以及其当前活动和进展的情况。
10:10
OminiX:为不同硬件平台上的生成式 AI 模型迈向统一库和加速框架
Time
10:10
Speakers
王言治
在生成式 AI 时代,一般用户需要应用不同的基础模型、微调检查点和 LoRA。此外,数据隐私和实时性要求将有利于在设备上本地部署大规模生成式 AI 模型。开发一个“即插即用”框架是可取的,这样用户可以下载任何生成式 AI 模型,单击并在自己的设备上运行。这对当前的 AI 部署框架提出了重大挑战,这些框架通常很耗时,并且需要人类对硬件和代码生成的专业知识。我们介绍了 OminiX 的努力,这是朝着统一库和加速跨各种硬件平台的生成式 AI 模型迈出的第一步。结合我们独特的前端库和即将开源的后端即时加速技术,我们展示了即插即用的部署能力和各种生成式人工智能模型的最先进的加速能力,从图像生成、大型语言模型、多模型语言模型、语音生成和语音克隆、实时聊天引擎、实时翻译、视频生成、实时头像等等。这可以在没有服务器的情况下实现,只需在每个人自己的平台上即可。
10:50
茶歇
Time
10:50
Speakers
20 分钟
11:10
神经手腕:可穿戴智能
Time
11:10
Speakers
陈瑶
神经手腕技术代表了可穿戴设备的一种创新方法,专门用于收集和分析生理电信号数据。这项先进的技术通常使用佩戴在手腕上的传感器来检测和记录各种生理参数,例如心率、血压和皮肤电活动。收集的数据为用户的健康状况提供了宝贵的见解,可用于多种应用,包括健康跟踪、医疗诊断和健康监测。
11:50
可穿戴AI:无缝交互的未来
Time
11:50
Speakers
綦思源
下一代可穿戴AI有望通过全天候舒适度和直观界面重新定义与技术的日常互动。这些设备将配备先进的显示技术,能够无缝融入用户的视野,以最少的侵入方式提供信息。与这些可穿戴设备的互动将如同人类对话一样自然,具备由AI驱动的个性化功能,能够适应个人偏好和行为。它们将充当中心节点,连接用户与智能设备网络,确保在生活各个方面的顺畅和集成体验。简而言之,下一波可穿戴AI将提供一种既不显突兀又紧密融入日常生活的个性化、互联体验。
12:30
午餐
Time
12:30
Speakers
14:00
SPAD图像传感器:2D与3D融合的基础
Time
14:00
Speakers
侯昌韬
使用基于 SPAD(单光子雪崩二极管)检测器形式的传感器,可以同时输出点云(距离)和图像(RGB颜色),实现2D和3D的完美融合。
14:40
以OpenXR赋能沉浸式混合现实体验
Time
14:40
Speakers
刘志鹏
首先,介绍OpenXR的基础知识;其次,介绍MR(混合现实)的基础知识;最后,介绍如何使用OpenXR开发身临其境的MR体验。
15:20
茶歇
Time
15:20
Speakers
30 分钟
15:50
下一代三维视频:挑战与实践
Time
15:50
Speakers
高山
相较于传统二维视频, 三维视频可以实现 "照片级真实渲染" 与 "6DOF沉浸交互" . 本次分享对三维视频的采集重建、编码传输、交互渲染、质量评价等维度介绍, 按技术路线、研发实践、未来趋势三个部分展开, 共建技术交流与探讨
18:00
Happy Hour
Time
18:00
Speakers