10月 17-18日, 2024

大会日程

参与六大主题分论坛,完整议程、会议时间、主题和发言人即将公布。别错过这些充满活力的会议!(更多会议信息将持续更新)

October 17

Time
Session
17
8:30
签到
Time
8:30
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
Time
8:30
17
9:30
GOSIM主讲: AGI时代的开源生态
Time
9:30
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
蒋涛
AGI时代的开源生态
Time
9:30
17
9:45
Opening Keynote: OpenHarmony移动解决方案
Time
9:45
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
周艳
华为提倡基于OpenHarmony, 推进移动终端操作系统的开放、并发、安全,结合终端轻量特点,为业界提供更有效的并行并发解决方案
Time
9:45
17
10:05
GOSIM Hackathon Awards Ceremony
Time
10:05
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
Winner of the GOSIM Hackathon will be announced.
Time
10:05
17
10:10
茶歇 (换场)
Time
10:10
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
20 分钟
Time
10:10
17
10:30
去中心化技术和下一代平台
Time
10:30
Track
下一代互联网
Speakers
Alan Majer
数字体验在很大程度上以集中式平台为媒介。这些占主导地位的平台面临着去中心化构件、人工智能和算法的颠覆——这为我们在开放的基础上重建平台、夺回数据和体验的控制权提供了新的机遇。本演讲将分享对 23 位致力于开放未来的人士进行研究访谈后得出的见解。
Time
10:30
17
10:30
OpenCV和空间智能
Time
10:30
Track
具身智能
Speakers
Gary Bradski
我将介绍即将发布的 OpenCV 版本以及目前在 “空间智能”(人工智能 + 空间中的 3D 姿态)方面的举措
Time
10:30
17
10:30
OPEN-SORA:高效低成本视频生成模型
Time
10:30
Track
AI 模型与基础设施
Speakers
尤洋
Open-Sora项目是全球首个类Sora开源复现方案,它创造了一个高效低成本的视频生成模型。本次演讲将从Open-Sora的核心理念出发,详细解析其独特的模型架构,展现这一架构对视频生成效率的优化和对成本的显著降低。演讲还会讨论Open-Sora如何在保持高质量输出的同时,实现对不同视频分辨率和长度的适应性,以及如何克服此类大模型训练中常遇到的数据存储问题,并在推理成本和内存使用两方面进行深入优化。Open-Sora模型以其趣味性和高质量在开源社区内反响热烈,本次演讲,我们还将展现这些开源社区的内的创作,和您一起探索视频生成领域的前沿技术。
Time
10:30
17
10:30
WGPU:Rust中的现代GPU编程
Time
10:30
Track
下一代媒体与终端
Speakers
Jim Blandy
GPU拥有卓越的性能——前提是你的问题能够适应其计算模型。超线程、局部内存空间、强制矢量化以及其他一些特性都会影响GPU代码的编写方式。WGPU 是一个跨平台的GPU编程API。
Time
10:30
17
10:30
使用Dioxus进行下一代应用程序开发:全栈、跨平台、强类型且快速
Time
10:30
Track
App开发
Dioxus 是一个 Rust 框架,它使开发者能够使用单个统一的代码库轻松发布网页、桌面和移动应用。在这次演讲中,我们将介绍一些特性,比如原生移动支持、实时热重载以及自定义的人工智能模型。
Time
10:30
17
10:30
寄存器分配在Cranelift中的作用
Time
10:30
Track
Rust 编程语言
寄存器分配是优化编译器中最关键的阶段之一,通常占用了编译时间的很大一部分。本次演讲将介绍 Cranelift 所使用的寄存器分配器,Cranelift 是一个用 Rust 编写的快速编译后端,并被 Rust 编译器所采用。演讲将重点关注其最新迭代版本 regalloc3,该版本目前正在开发中。
Time
10:30
17
10:30
Makepad实际应用:构建你的第一个应用程序
Time
10:30
Track
工作坊: Makepad App 开发
本次实践研讨会介绍了 Makepad 的强大功能和灵活性,Makepad 是一款用于跨平台开发的尖端 UI rust 框架。 参与者将:学习 Makepad GUI 框架的核心概念, 构建功能性应用程序,从简单的小部件到高级功能, 实现现代 UI 元素和交互, 获得适用于移动和桌面平台的实践经验 适合所有级别的开发人员,从初学者到经验丰富的程序员。在工作坊结束时,您将创建自己的跨平台应用程序并掌握继续使用 Makepad 进行开发的技能。
Time
10:30
17
10:30
Workshop: W3C DID Forum
Time
10:30
Track
工作坊: W3C DID Forum
Speakers
W3C发布的Decentralized Identifiers (DIDs)标准是一种新型标识符,支持可验证的、去中心化的数字身份,为保护用户隐私和基于授权的数据共享权益提供更好的支持。 2024年10月17-18日在北京举办的GOSIM2024大会期间,将于17日上午举办一场关于W3C DID技术标准的专题研讨 (W3C DID Forum)。本次研讨主要以互动交流为主,W3C DID 标准编辑 Drummond Reed将为大家介绍DID技术标准的最新进展及未来发展方向,并就国内业界感兴趣的DID话题和大家进行交流。同时还有多位来自国内外的相关领域资深技术专家,与现场观众进行互动,欢迎报名参与!
Time
10:30
17
10:30
Contribution-Oriented Open Source Talent Evaluation System and Its Application
Time
10:30
Track
工作坊: 开源教育论坛
Speakers
王伟
The contribution-based open source talent evaluation system provides a fair and transparent incentive mechanism for open source communities while helping companies identify and cultivate open source talent. This presentation introduces the open source governance standard released by the Ministry of Industry and Information Technology, which defines the measurement of open source contributions. Through specific case studies, the application of this evaluation system in practice is demonstrated. By co-creating the OpenTalent open source talent evaluation platform, we aim to assist enterprises, educational institutions, and governments in accurately identifying and cultivating open source talent, thereby promoting the healthy and sustainable development of the global open source ecosystem.
Time
10:30
17
10:45
高校如何参与开源贡献——开源之夏实践之路
Time
10:45
Track
工作坊: 开源教育论坛
Speakers
李梦
高校学生如何在开源之夏有效参与开源
Time
10:45
17
11:10
Eclipse Zenoh:面向普遍与异构AI场景的通信骨干网
Time
11:10
Track
具身智能
人工智能已变得无处不在,用新技术增强了我们的许多互动。这种无所不在的现象需要一个强大的通信骨干网,使数据能够无缝流动。本讲座将详细介绍下一代通信中间件Eclipse Zenoh。
Time
11:10
17
11:10
建设以用户为中心的互联网
Time
11:10
Track
下一代互联网
Speakers
赵睿
互联网越来越多地集中在少数几个大平台上,导致了许多忽视或损害用户利益的问题。近年来,人们更加关注以用户为中心的去中心化架构。在本讲座中,我将简要回顾不同的思路,并重点介绍网络发明人蒂姆-伯纳斯-李提出的一种方法--Solid(社会关联数据),以重新分散网络。我将介绍它的主要原则、目前提供的内容,以及(我们团队)为扩展其边界所做的探索。最后,我将提出对 “稳固 ”的展望和相应的开放性问题,以激励未来的发展。
Time
11:10
17
11:10
透过维护者的眼睛: 如何让你的贡献更成功
Time
11:10
Track
Rust 编程语言
Speakers
Ed Page
无论是对Rust项目、你最喜欢的Rust工具,还是你使用的库,第一次贡献可能会让人感到畏惧。进入了一个不了解其社交动态和技术期望的领域。我将从维护者的角度引导你完成贡献的过程,以便你能更好地理解这一流程,并提高你的贡献被接受且迅速采纳的可能性。
Time
11:10
17
11:10
FlagOpen中Aquila系列中英双语大模型的构建与开源
Time
11:10
Track
AI 模型与基础设施
Speakers
王良栋
北京智源人工智能研究院自成立以来一直致力于开源开放,FlagOpen开源体系覆盖大模型的多个方面。本次主要围绕Aquila系列中英双语大模型介绍智源在自然语言大模型的研发工作和开源项目,具体包括算法方案、预训练与对齐算法框架、预训练与对齐数据集构建与开源。
Time
11:10
17
11:10
Flutter:谷歌的单代码库UI工具包,适用于移动、Web和桌面应用
Time
11:10
Track
App开发
Speakers
Kevin Moore
Flutter是一个开源框架,允许开发者从单一代码库构建美丽且原生编译的多平台应用程序。
Time
11:10
17
11:10
Khronos Vulkan标准最新进展介绍
Time
11:10
Track
下一代媒体与终端
Speakers
蔡康颖
介绍Khronos Vulkan标准,标准最新进展,和一些新Vulkan feature。
Time
11:10
17
11:50
开源模拟在具身智能时代的作用
Time
11:50
Track
具身智能
在 “具身人工智能 ”时代,开源仿真平台在推动创新与合作方面发挥着举足轻重的作用。本讲座探讨了开放性与封闭性软件/API之间的平衡,强调了在开发强大的嵌入式人工智能仿真工具时对灵活性和可扩展性的需求。通过将 CARLA 作为一个案例进行研究,我将重点介绍开源计划如何促进社区参与、加速研究以及提供满足不同研究需求的适应性工具。
Time
11:50
17
11:50
WGMath:用于跨平台 GPU 科学计算的可重复使用 WebGPU 着色器
Time
11:50
Track
下一代媒体与终端
使用 WebGPU,WGMath 旨在通过为所有科学界提供可重复使用的 WGSL 着色器来将 GPU 科学计算引入所有平台。我们将讨论这个生态系统的基础知识、LLM、几何学和物理学的当前和未来特征。
Time
11:50
17
11:50
Rust编译器概述
Time
11:50
Track
Rust 编程语言
本讲座将概述Rust编译器:它的外观、工作原理、内部结构以及开发过程。
Time
11:50
17
11:50
Blitz:模糊 Web 与原生之间的界限
Time
11:50
Track
App开发
Speakers
Nico Burns
介绍 Blitz,一种新的跨平台应用程序运行时,它结合了与 Web 兼容的“一次编写、随处运行”的 UI 代码,在部署到本机(非 Web)平台时具有较小的占用空间和强大的系统集成。
Time
11:50
17
11:50
Palpo社交服务器:支持 Matrix 协议的自托管社交服务器
Time
11:50
Track
下一代互联网
Speakers
杨学成
Rust实现的个人云部署的开源的Matrix服务器
Time
11:50
17
11:50
书生浦语大模型开源开放体系
Time
11:50
Track
AI 模型与基础设施
Speakers
高剑飞
InternLM 由上海人工智能实验室开发。我们保留开源的高质量 LLM 以及用于开发和应用的全栈工具链。在本次演讲中,我们将分享InternLM及其相关工具链的最新发展,涵盖代理、评估和人工智能基础设施等领域。
Time
11:50
17
12:30
午餐
Time
12:30
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
Time
12:30
17
14:00
如何编写你的 Rust 代码检查工具
Time
14:00
Track
Rust 编程语言
本讲座将向你展示如何使用rustc_tools crate(它允许你访问 rust 编译器 API)编写自己的rust linter。如果你的项目需要特定的衬底,但又无法将其添加到clippy 中,那么它将非常有用。本章还将解释编译器API的工作原理,并在最后给出一个小例子来展示其实际应用。
Time
14:00
17
14:00
开源的文字转视频模型:CogVideoX
Time
14:00
Track
下一代媒体与终端
Speakers
张昱轩
本议题将介绍 CogVideoX,它是一个大型扩散变换器模型,专为根据文本提示生成视频而设计。 结果表明,CogVideoX 在多个机器指标和人工评估方面都表现出了最先进的性能。CogVideoX 的模型权重可通过 https://github.com/THUDM/CogVideo 公开获取。
Time
14:00
17
14:00
基于OpenHarmony的开源机器人操作系统
Time
14:00
Track
具身智能
Speakers
巴延兴
技术进步、人口老龄化等众多因素正在推动机器人产业的蓬勃发展,而目前市面上还没一款正式的完全面向机器人的操作系统。OpenHarmony是一款面向全场景、全连接、全智能时代的智能终端设备操作系统,它基于软总线的分布式能力等技术特性和机器人对OS的诉求高度契合。深开鸿联合多家头部企业和高校在OpenHarmony技术指导委员的指引下在开源社区推出了基于OpenHarmony的机器人操作系统开源版,本议题将围绕这款OS的系统架构、技术特点、行业应用等方面展开介绍。
Time
14:00
17
14:00
从区块链到Web3:构建去中心化网络
Time
14:00
Track
下一代互联网
Speakers
黄华威
可扩展性已成为区块链底层的一个关键研究方向。学术界提出了多种代表性解决方案以改善区块链的可扩展性,如有向无环图技术、分片技术、新共识机制、状态通道、侧链和跨链等。其中,分片技术被认为是一种具有巨大潜力的第一级扩展解决方案,可以显著提高区块链的可扩展性。本文首先整理了区块链分片技术的研究现状,然后介绍了黄教授研究团队基于分片区块链构建的新DeFi协议——BrokerFi。
Time
14:00
17
14:00
自动驾驶的仿真、测试、验证和确认
Time
14:00
Track
工作坊: SDV 峰会
Speakers
杨子江
仿真、测试、验证和确认 (STV2) 是一组从安全和成本角度支持自动驾驶系统的开发、验证和运行的流程。本次演讲将介绍STV2的范围、架构和关键组件,以及如何涵盖自动驾驶系统的整个生命周期。STV2 是自动驾驶架构基础设施和工具层的一部分。
Time
14:00
17
14:00
使用完全开源的Moxin 7B模型揭开LLM训练的神秘面纱
Time
14:00
Track
AI 模型与基础设施
Speakers
王言治
最近,大型语言模型(LLM)经历了重大转变,其受欢迎程度和功能均迅速上升。开源 LLM,例如 LLaMa 和 Mistral,由于易于在各种应用程序中自定义和部署模型,为 LLM 的日益普及做出了巨大贡献。尽管LLM为研究和创新提供了前所未有的机会,但其商业化引起了人们对透明度、可重复性和安全性的担忧。许多开放的LLM模型缺乏必要的组件(例如训练代码和数据),以实现充分理解和可重复性,有些则使用限制性许可证,同时声称是 “开源”,这可能会阻碍LLM的进一步创新。为了缓解这个问题,我们遵循模型开放性框架 (MOF),这是一个排名分类系统,它遵循开放科学、开源、开放数据和开放获取的原则,根据机器学习模型的完整性和开放性对其进行评级。我们提供了一个真正的开源 LLM Moxin 7B,并发布预训练代码和配置、训练和微调数据以及中间和最终检查点,旨在对完全开源 LLM 做出持续承诺。
Time
14:00
17
14:00
开场致辞
Time
14:00
Track
工作坊: Triton 语言与 vLLM
Speakers
林咏华
开场致辞
Time
14:00
17
14:00
面向全场景应用的新一代编程语言-仓颉
Time
14:00
Track
工作坊: 仓颉编程语言
Speakers
董鑫
仓颉(Cangjie)是一种新一代的编程语言,旨在支持全场景应用。
Time
14:00
17
14:00
uni-app x:新一代、纯原生跨平台框架
Time
14:00
Track
App开发
Speakers
崔红保
近些年,跨平台开发早已是大家熟知的一种开发范式,但跨平台开发依然常被开发者诟病?原因何在?如何改进解决?\r\n本次演讲,我将分享uni-app团队对此问题的思考和探索,对原生、H5、小程序三个平台,分别阐述其性能堵点及优化实践,并将介绍 uni-app x 这个新的跨平台框架。uni-app x采用类TS的DSL,通过Rust编译成swift/Kotlin/arkTS,获得纯正原生App,在彻底解决传统Hybrid App性能顽疾的前提下,借助web生态,解放生产力,快速交付。
Time
14:00
17
14:00
The Dexterous Hand of Self-Evolution,The Key to Opening the Door to Embodied Intelligence
Time
14:00
Track
具身智能
Speakers
David Cui
The dexterous hand of self-evolution,The key to opening the door to embodied intelligence
Time
14:00
17
14:25
仓颉助力鸿蒙原生应用高效开发关键技术介绍
Time
14:25
Track
工作坊: 仓颉编程语言
Speakers
徐潇
介绍仓颉鸿蒙应用开发中涉及的关键技术。
Time
14:25
17
14:30
vLLM在月之暗面的应用实践与未来展望
Time
14:30
Track
工作坊: Triton 语言与 vLLM
Speakers
许欣然
1、vLLM 在 Moonshot 的大规模应用 2、vLLM 与 Mooncake PD 分离架构 3、未来发展的前景与方向
Time
14:30
17
14:30
中国电动汽车百人会概述
Time
14:30
Track
工作坊: SDV 峰会
Speakers
Jason Zhang
中国电动汽车百人会(ChinaEV100)是中国电动汽车和智能网联汽车领域的一个跨学科、跨行业、跨部门、跨所有制的非官方、非营利性政策和学术研究平台。它是一个高端的交流平台,由政府官员、专家、学者和行业专业人士自愿参与组成。中国电动汽车百人会是国家在汽车领域的第三方智库。
Time
14:30
17
14:40
针对Rust的增量链接和热代码重载
Time
14:40
Track
App开发
编辑-构建-运行的开发周期缓慢是 Rust 开发人员普遍抱怨的问题。Wild 项目旨在通过构建 Rust 的链接器来解决这一问题,其目标是最终支持增量链接和热代码重载。
Time
14:40
17
14:40
Rust项目贡献者之路
Time
14:40
Track
Rust 编程语言
Jane Losare-Lusby 将带您回顾她作为 Rust 项目贡献者的经历。从早期在 Clippy 项目上的工作开始,Jane 经历了各种角色,包括错误处理项目组负责人、库和样式团队成员,以及 Rust 基金会董事会成员。在短暂中断 Truffle 和 June 的工作后,她重返 Rust 编译器团队,目前主要负责本地存储度量的开发。 在本讲座中,Jane将分享她在应对冒名顶替综合症、冲突解决、职业倦怠和孤独感等挑战方面的个人见解。Jane 为希望为 Rust 做出贡献的新人提供实用建议,强调导师和联系的重要性、各种Rust团队的动态,以及如何将一个想法(如她目前的度量计划)转化为有意义的贡献。 无论您是经验丰富的开发人员,还是刚刚起步,本讲座都将为您提供宝贵的观点,帮助您找到自己的位置,并在Rust社区中发挥影响。
Time
14:40
17
14:40
功能型无人车任务建模方法
Time
14:40
Track
具身智能
Speakers
岑明
作为执行配送、销售、穿梭、安全巡逻等智能任务的载体,功能型无人车可以说是体现智能的典型代表。考虑到智能任务的多样性,设计一套通用的任务建模和执行方法对于实现功能型无人车的快速开发和部署具有重要意义。
Time
14:40
17
14:40
Robrix:纯Rust实现的Matrix客户端及其功能
Time
14:40
Track
下一代互联网
Speakers
Kevin Boos
Robrix是一个新的Marix客户端,在成为联邦服务的中心枢纽中央。通过基于 Robius 应用开发框架构和 Makepad 用户界面工具包构建,Robrix 能在多个平台和设备上无缝运行,无需编写 PruncTSeap 的代码。这不仅仅是提高了开发效率,还提供了用户在不同设备间获得一致的使用体验。Robrix 的设计理念是促进开放通信,同时提供高度可定制的界面和强大的功能集,以满足不同用户群体的需求需求。
Time
14:40
17
14:40
迈向实用化多模态大模型
Time
14:40
Track
AI 模型与基础设施
Speakers
余天予
多模态大模型作为迈向通用人工智能的必由之路,展现了智能跃迁的巨大潜力。它不仅是学术探索的前沿,更是构建人类命运共同体,促进全球合作的催化剂。高昂的部署推理成本、频繁的幻觉行为、稀缺的高质量数据都极大制约了多模态大模型的发展,MiniCPM-V 从这些关键问题入手,首次实现了和闭源商用多模态大模型可比的端侧多模态理解能力。
Time
14:40
17
14:40
Open-Sora Plan: 基于国产算力的视频生成大模型开源计划
Time
14:40
Track
下一代媒体与终端
Speakers
程鑫华
Open-Sora Plan是支持全程在昇腾算力上进行计算的国产视频生成大模型开源计划。本次演讲介绍Open-Sora Plan的进展,细节和规划。
Time
14:40
17
14:50
仓颉面向鸿蒙原生应用开发实践
Time
14:50
Track
工作坊: 仓颉编程语言
Speakers
谈家梁
本文介绍了如何使用仓颉开发鸿蒙原生应用,并为开发者提供了开发仓颉版本鸿蒙应用的参考。
Time
14:50
17
15:00
vLLM遇见Qwen:阿里巴巴通义实验室的优化与贡献
Time
15:00
Track
工作坊: Triton 语言与 vLLM
Speakers
何涛
本次演讲将分享阿里巴巴通义实验室在vLLM 上为 Qwen模型提供高效服务所做的优化工作。这些优化包括模型量化、框架性能增强和算法改进。此外,演讲还将重点介绍团队对 vLLM 开源社区的贡献,并讨论 Qwen 系列模型在未来可能给 vLLM 带来的新的挑战。
Time
15:00
17
15:00
茶歇
Time
15:00
Track
工作坊: SDV 峰会
Speakers
30 分钟
Time
15:00
17
15:15
仓颉语言开源微服务框架microservice开发实践
Time
15:15
Track
工作坊: 仓颉编程语言
Speakers
赵刚
Cangjie language, with its unique syntax and powerful functions, has brought new vitality to the field of programming. Combining the flexibility and scalability of microservice architecture, while exploring the boundaries of modern software development, an open source microservice framework based on Cangjie language was open sourced. This project aims to combine the characteristics of Cangjie language with the advantages of microservice architecture to provide developers with an efficient, reliable and easy-to-maintain solution, whether it is a highly customizable Internet application or an enterprise-level solution that requires stable operation, hoping to create a development environment that can adapt to rapidly changing needs.
Time
15:15
17
15:20
茶歇
Time
15:20
Track
AI 模型与基础设施
App开发
具身智能
下一代互联网
下一代媒体与终端
Speakers
30 分钟
Time
15:20
17
15:30
自动驾驶仿真的场景表示与Oasis仿真系统
Time
15:30
Track
工作坊: SDV 峰会
Speakers
潘余曦
将介绍自动驾驶模拟中场景表示的标准化工作。讨论将涵盖模拟系统中的各种元素,例如传感器模型、车辆动力学模型和代理行为模型等,并以绿洲模拟系统为例进行说明。
Time
15:30
17
15:30
vLLM:一个简单、高效且用户友好的大模型推理框架
Time
15:30
Track
工作坊: Triton 语言与 vLLM
Speakers
游凯超
本次演讲将涵盖以下关键点: vLLM 项目的起源与发展。 vLLM 支持的模型、硬件和功能。 vLLM 的社区建设及近期计划展望。
Time
15:30
17
15:50
炉边谈话
Time
15:50
Track
Rust 编程语言
来自Rust项目语言、库和Cargo团队的Josh Triplett博士进行轻松愉快的采访和问答。
Time
15:50
17
15:50
CodeGeeX4:应用于人工智能编程的多功能代码生成模型
Time
15:50
Track
AI 模型与基础设施
Speakers
郑勤锴
我们介绍最新 CodeGeeX4 模型系列的开源版本 CodeGeeX4-ALL-9B。它是在 GLM-4-9B 基础上持续训练的多语言代码生成模型,大大增强了代码生成能力。使用单个 CodeGeeX4-ALL-9B 模型,可支持代码自动补全与生成、代码解释器、网页搜索、函数调用、版本库级代码问答等综合功能,覆盖软件开发的各种场景。CodeGeeX4-ALL-9B 在 BigCodeBench 和 NaturalCodeBench 等公开基准测试中取得了极具竞争力的性能。它是目前参数小于 10B 的最强大代码生成模型,甚至超过了更大的通用模型,在推理速度和模型性能方面实现了最佳平衡。
Time
15:50
17
15:50
将Servo应用到OpenHarmony
Time
15:50
Track
App开发
将用Rust编写的网络渲染引擎servo移植到OpenHarmony的最新进展。
Time
15:50
17
15:50
FaceChain在数字人领域的发展与演进
Time
15:50
Track
下一代媒体与终端
Speakers
孙佰贵
FaceChain,是一个在人脸感知理解、数字写真、说话视频生成等方面都有创新的数字人开源项目,正在引领数字人领域的新浪潮。用户仅需一张照片,即可创建个性化的数字形象,并利用多样化的风格和模版库生成独特的写真作品。FaceChain提供了全栈的数字写真生成功能,即包含保10s免训练数字写真生成功能,也包含DIY风格模型快速训练功能,目前正在构建数字写真内容生态中。除此之外,FaceChain在生成说话视频和虚拟试衣上也有相应布局与产出。FaceChain以其开源精神和社区活力,推动了技术的快速发展和广泛应用。本议题将深入探讨FaceChain的技术特点、社区建设、商业应用前景以及其在数字人领域的演进路径。
Time
15:50
17
15:50
面向工业领域大模型驱动的机器人技术
Time
15:50
Track
具身智能
Speakers
杨磊
在工业领域,对数据驱动的机器人技术的需求不断增长。其技术路径包括先进的传感器技术、机器学习算法和实时数据处理。然而,我们也面临着诸如数据安全和系统互操作性等挑战。
Time
15:50
17
15:50
Moxin 增加大模型去中心化的分发能力
Time
15:50
Track
下一代互联网
Speakers
蔡书
随着人工智能的发展,大型语言模型(LLM)在各个行业的应用日益广泛,但模型文件的集中化分发方式仍面临着基础设施成本高、访问受限等问题。Moxin 通过去中心化的分发模型文件的方式,专注于模型文件的高效、安全传输,旨在解决这些挑战。
Time
15:50
17
15:50
工行鸿蒙原生应用仓颉开发实践
Time
15:50
Track
工作坊: 仓颉编程语言
Speakers
张健
工商银行在开发鸿蒙原生应用仓颉的过程中,从试点场景和实施方案等方面分享了实践经验。
Time
15:50
17
16:00
开放与协作的汽车操作系统创新赋能汽车行业的发展与创新
Time
16:00
Track
工作坊: SDV 峰会
Speakers
梁浩
在汽车行业技术革新的浪潮中,安全可控的汽车操作系统已成为核心。然而,技术的复杂性、巨大的投资需求以及漫长的开发周期,导致了技术进步与专业人才之间出现了鸿沟。面对行业问题、新的OEM需求以及国际趋势和政策,采取开源开发路径是一种合理的选择。本演讲将重点关注汽车操作系统的开源赋能、iSOFT开源项目以及协作开发计划。
Time
16:00
17
16:00
基于摩尔线程全功能GPU的Triton编译器实现
Time
16:00
Track
工作坊: Triton 语言与 vLLM
Speakers
吴庆
1、摩尔线程全功能 GPU 架构介绍 2、摩尔线程 MUSA 软件生态系统概览 3、摩尔线程 Triton 编译器的实现与 FlagGems 的适配
Time
16:00
17
16:10
力扣鸿蒙原生应用仓颉开发实践
Time
16:10
Track
工作坊: 仓颉编程语言
Speakers
鄂宇鑫
分享使用仓颉语言在鸿蒙操作系统上开发LeetCode应用的实践
Time
16:10
17
16:30
压缩无处不在:Rust中的即插即用式压缩
Time
16:30
Track
下一代互联网
在网络上加载几乎所有内容时都会用到数据压缩。本讲座将介绍我们如何在 rust 中实现 zlib-rs 和其他压缩算法,使其与C语言的相应算法兼容。
Time
16:30
17
16:30
低级别编程:Rust教育的“下一件大事”
Time
16:30
Track
Rust 编程语言
Speakers
Bart Massey
Rust社区在Rust入门教学工具方面已经有了一个良好的开端。我将回顾 Rust 教育的现状,尤其是在大学中的情况,并谈谈Rust-Edu和其他团体希望通过哪些方式来满足低级语言领域的新需求。
Time
16:30
17
16:30
具身智能行动学习所需的数据要素有哪些?
Time
16:30
Track
具身智能
Speakers
黄浴
大规模语言模型(LLM)出现之后,具身人工智能(Embodied AI)的发展被视为实现通用人工智能(AGI)的基本路径。然而,与LLM相比,数据目前是具身AI进步的关键瓶颈。在本次演讲中,首先分析了学习策略,特别是针对具身操作的学习策略。同时,调查了现有具身AI领域的多种公开数据集。最终,总结出了一个必要的具身AI数据集的要求,并介绍了一个即将推出的由虚幻引擎5渲染的合成视频数据集,名为MVGameIR。
Time
16:30
17
16:30
Functionary: 利用工具与大型语言模型协同工作
Time
16:30
Track
AI 模型与基础设施
Functionary是一个开源的大型语言模型(LLM),能够在保持对话能力的同时使用工具。我们将讨论如何通过函数调用来实现复杂的代理任务,以及我们如何解决函数调用过程中遇到的挑战。
Time
16:30
17
16:30
GenUI:基于 Makepad 的声明式 Rust 跨平台框架
Time
16:30
Track
App开发
Speakers
盛逸飞
GenUI 是一个新的 Rust 语言开发的创新 SFP 前端框架。它最初的灵感来自 Vue3 和 Makepad。它在帮助助用户有效使用Rust编程编写前端项目。
Time
16:30
17
16:30
Pointrix:一个可微分的基于点的渲染库
Time
16:30
Track
下一代媒体与终端
Speakers
陈林卓
在过去的一年中,以三维高斯溅射为代表的可微分点云渲染技术取得了重大进展。本报告将介绍 Pointrix,这是我们的研究小组开发的可微分点云渲染优化框架。Pointrix 由模块化的 Python API、高效的 CUDA 后端和用户友好的实时渲染 GUI 界面组成,使其成为易于扩展的开源点云渲染框架。Pointrix 提供详细的快速入门指南和丰富的示例配置,允许用户通过在 Python 级别进行更改来实现特定的算法。它为研究人员提供了可移植的二次开发环境。此外,Pointrix 支持一系列与 3DGS 相关的主流工作,为可微分点云渲染领域的研究和应用提供强有力的支持。
Time
16:30
17
16:30
CARLA 开源项目更新
Time
16:30
Track
工作坊: SDV 峰会
CARLA 新版本和功能。CARLA 是一款用于自动驾驶研究的开源模拟器。CARLA 是从头开始开发的,旨在支持自动驾驶系统的开发、培训和验证。
Time
16:30
17
16:30
多模态压缩与推理:探索vLLM中FlagScale的应用实践和技术细节
Time
16:30
Track
工作坊: Triton 语言与 vLLM
大模型因其在各种任务中的卓越表现而受到广泛关注。然而,在资源受限的场景下,大模型所需的大量计算和内存资源给推理带来了诸多挑战。因此,业界正在积极开发技术以提高大模型的推理效率。本报告将分享 FlagScale 在基于 vLLM 框架压缩和推理多模态大模型的实践经验,重点包括: 1、vLLM 框架的相关模块、策略和性能分析:特别关注新增的 CFG Sampling 特性。 2、使用 llm-compressor 工具进行多模态模型的量化压缩:根据不同部署场景,以不同粒度进行压缩,并探索多模态模型与语言模型的差异,以及如何实现多模态模型的极致压缩。
Time
16:30
17
16:30
科蓝鸿蒙TEE架构增强型多因素身份认证组件仓颉开发案例实践
Time
16:30
Track
工作坊: 仓颉编程语言
Speakers
李彦迎
仓颉编程语言 + 鸿蒙操作系统案例分享
Time
16:30
17
16:50
泛微鸿蒙原生应用:EMobile10仓颉开发实践
Time
16:50
Track
工作坊: 仓颉编程语言
Speakers
韩泽宇
介绍软件开发的鸿蒙原生应用EMobile10仓颉的开发过程,并分享使用仓颉的实践经验。
Time
16:50
17
17:00
Triton中国社区开发者贡献计划
Time
17:00
Track
工作坊: Triton 语言与 vLLM
Speakers
田国伟
Triton中国社区开发者贡献计划
Time
17:00
17
17:10
Rust程序的不同链接方式在交易系统中的典型应用
Time
17:10
Track
Rust 编程语言
Speakers
乔丹
本次会议演讲将深入探讨工作区、目标和箱子类型的基本概念。它将展示交易系统中的三个案例,重点介绍使用 -crate-type=lib 进行代码依赖和静态链接、使用 -crate-type=cdylib 进行动态链接以及使用 -crate-type=rlib 进行静态链接。此外,演讲还将扩展讨论重要方面,例如动态链接和静态链接之间的性能差异,以及使用 rlib 时在工具链版本灵活性方面的权衡。
Time
17:10
17
17:10
元象大模型的实践探索
Time
17:10
Track
AI 模型与基础设施
Speakers
轩文烽
主要介绍元象大模型在从0到1,从Dense到MoE的研发过程中的实践探索,包括数据、模型、架构等方面。数据层面,大模型需要哪些数据,怎么加工处理,怎么迭代更新;模型层面,从Dense到MoE,如何设定专家大小、专家权重;架构层面,如何提升训练效率,如何保证稳定训练等。
Time
17:10
17
17:10
InfoQ鸿蒙原生应用:写作社区仓颉开发实践
Time
17:10
Track
工作坊: 仓颉编程语言
Speakers
张云波
InfoQ Cangjie Practice
Time
17:10
17
17:10
开放世界的具身大模型
Time
17:10
Track
具身智能
Speakers
Jiaming Liu
多模态大语言模型(MLLMs)已在各种任务中展示了在视觉指令跟随方面的潜力。最近,一些研究将 MLLMs 集成到机器人操作中,使机器人能够解释多模态信息并预测低级动作。尽管基于 MLLM 的策略已经显示出令人鼓舞的进展,但在面对新任务或类别时,它们可能会预测出失败的执行姿势。鉴于这些挑战,我们提出一个问题:“我们能否开发一种端到端的机器人代理,不仅具备操作技能,还能有效纠正低级失败动作?” 借鉴丹尼尔·卡内曼的观点,即“人类思维分为快速系统和慢速系统,分别代表直觉过程和更为逻辑的推理”,我们介绍了一系列模仿人类思维方式的研究工作,以解决上述问题。
Time
17:10
17
17:30
规约类算子的 triton kernel 优化模式
Time
17:30
Track
工作坊: Triton 语言与 vLLM
Speakers
陈飞宇
Triton 语言提供了面向数据块的线程块级别的编程模式,在对硬件的细粒度控制和心智负担之间取得了较好的平衡,使得非 gpu 编程专家也可以在较短时间内写出性能不错的 kernel. 但使用 triton 来编写一般用途的算子库时,还需要根据不同情况,比如形状和数据排布等,选择合适的算法和任务划分方案来取得更好的性能。本报告将以 softmax 算子的优化为例,分享 reduce 类算子的优化技巧和常用模式:persistent reduction, online softmax normalizer, split-reduction, outer reduction 的任务划分方案等.
Time
17:30