ResNet作者，阶跃星辰首席科学家张祥雨入选 MIT “35 岁以下科技创新 35 人”

基于该框架，阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V，与 Google 的首个同类模型 Gemini 1.0 几乎同时发布，多模态理解能力显著高于当时业界主流的视觉-语言分离式的架构。2025 年 5 月 23 日，在上海举办的 2024 年度“35 岁以下科技创新 35 人”中国区发布暨中国科技青年论坛上，新一届入选者正式揭晓，他们以卓越的创新成果和非凡的创造力，成为了中国

深度学习技术前沿

382人浏览 · 2025-05-30 11:31:32

深度学习技术前沿 · 2025-05-30 11:31:32 发布

来源：DeepTech深科技

2025 年 5 月 23 日，在上海举办的 2024 年度“35 岁以下科技创新 35 人”中国区发布暨中国科技青年论坛上，新一届入选者正式揭晓，他们以卓越的创新成果和非凡的创造力，成为了中国科技领域的耀眼新星。

这 35 位科技青年中，有人以开源生态推动技术普惠，有人以合成数据突破具身智能瓶颈，有人将光合系统跨物种移植逆转退行性疾病，有人用拓扑超材料改写声波操控法则。他们攻克科学难题，开拓交叉领域，书写中国科技“链式反应”：从实验室原子级成像到生产线分钟级装配，再从微观蛋白质降解到宏观量子优越性验证，通过不断拓展人类认知边界，在全球技术竞争中刻下中国坐标。

“从 0 到 1”，从 35 到无限——在中国，创新的故事永远有下一章。

2024 年度“35 岁以下科技创新 35 人”中国区入选名单如下（*以下排名不分先后）：

他提出了业内最早的图文生成理解一体化的多模态大模型架构之一，并发布中国首个千亿参数原生多模态大模型。

张祥雨致力于研究通用神经网络的设计、训练和优化方法，不断提升模型的实用性和智能水平。目前张祥雨博士的 Google Scholar 引用数超过 37 万次，H-index 66。

他提出 RepVGG，通过引入重参数化的思想，训练时可以采用较复杂的结构实现高准确度，而在推理阶段等价变换回一种简单的结构（例如 VGG），以方便硬件推理。后续，同样基于重参数化思路，通过对已有视觉 Transformers（ViTs）的机理进行深入分析，张祥雨提出了一种不同于 ViTs 的超大卷积核架构 RepLKNet，性能超越了主流的 ViTs，且结构简单易部署。

张祥雨现任大模型公司阶跃星辰首席科学家。与很多大模型公司选择以大语言模型为起点不同，该公司从图文交错式语料出发，直接训练原生图文多模态大模型。他提出了业内最早的图文生成理解一体化的多模态大模型架构之一——DreamLLM 多模态大模型框架。

基于该框架，阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V，与 Google 的首个同类模型 Gemini 1.0 几乎同时发布，多模态理解能力显著高于当时业界主流的视觉-语言分离式的架构。之后，他们还相继发布了万亿参数 MoE 基座大模型 Step-2、视频生成大模型 Step-Video、图文语音三模态理解大模型 Step-1o 以及推理模型 Step R-mini 等。

推荐阅读

欢迎大家加入DLer-大模型技术交流群！

👆 长按识别，邀请您进群！

火山引擎开发者社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OBS Studio音频分离：人声与背景音乐分离全攻略

你是否曾在直播或录屏时遇到这样的困境：想要单独调整人声音量却影响了背景音乐，或是后期剪辑时无法消除环境噪音？OBS Studio（Open Broadcaster Software Studio，开放广播软件工作室）作为免费开源的音视频录制与直播工具，提供了强大的音频处理框架，通过合理配置滤镜链与外部工具组合，可实现专业级别的人声与背景音乐分离。本文将系统讲解3种分离方案，从基础声道分离到AI驱动

火山引擎开发者社区

lmstudio-python：简化LLM操作的强大Python SDK

lmstudio-python 是一款功能强大的 Python SDK，旨在帮助开发者轻松地使用大型语言模型（LLM）进行文本生成、对话系统搭建以及其他相关应用。通过简单易用的API，lmstudio-python 能够让用户快速集成 LLM 功能，无论是进行基础文本补全还是复杂的对话系统设计。## 项目技术分析lmstudio-python SDK 以 Python 为基础，提供了一个同

火山引擎开发者社区

OBS Studio AI增强：智能场景识别与自动优化全攻略

你是否曾在直播切换场景时手忙脚乱？是否因复杂的参数配置而错失最佳直播时机？OBS Studio作为开源直播软件的佼佼者，虽提供强大的自定义功能，但传统手动操作已难以满足专业创作者对效率和质量的双重需求。本文将系统介绍如何通过AI技术增强OBS Studio的核心能力，重点实现智能场景识别与自动参数优化，让你的直播制作流程效率提升300%。读完本文你将获得：- 基于OpenCV的实时场景分析插