ResNet作者,阶跃星辰首席科学家 张祥雨入选 MIT “35 岁以下科技创新 35 人”
基于该框架,阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V,与 Google 的首个同类模型 Gemini 1.0 几乎同时发布,多模态理解能力显著高于当时业界主流的视觉-语言分离式的架构。2025 年 5 月 23 日,在上海举办的 2024 年度“35 岁以下科技创新 35 人”中国区发布暨中国科技青年论坛上,新一届入选者正式揭晓,他们以卓越的创新成果和非凡的创造力,成为了中国
来源:DeepTech深科技
2025 年 5 月 23 日,在上海举办的 2024 年度“35 岁以下科技创新 35 人”中国区发布暨中国科技青年论坛上,新一届入选者正式揭晓,他们以卓越的创新成果和非凡的创造力,成为了中国科技领域的耀眼新星。
这 35 位科技青年中,有人以开源生态推动技术普惠,有人以合成数据突破具身智能瓶颈,有人将光合系统跨物种移植逆转退行性疾病,有人用拓扑超材料改写声波操控法则。他们攻克科学难题,开拓交叉领域,书写中国科技“链式反应”:从实验室原子级成像到生产线分钟级装配,再从微观蛋白质降解到宏观量子优越性验证,通过不断拓展人类认知边界,在全球技术竞争中刻下中国坐标。
“从 0 到 1”,从 35 到无限——在中国,创新的故事永远有下一章。
2024 年度“35 岁以下科技创新 35 人”中国区入选名单如下(*以下排名不分先后):


他提出了业内最早的图文生成理解一体化的多模态大模型架构之一,并发布中国首个千亿参数原生多模态大模型。
张祥雨致力于研究通用神经网络的设计、训练和优化方法,不断提升模型的实用性和智能水平。目前张祥雨博士的 Google Scholar 引用数超过 37 万次,H-index 66。
他提出 RepVGG,通过引入重参数化的思想,训练时可以采用较复杂的结构实现高准确度,而在推理阶段等价变换回一种简单的结构(例如 VGG),以方便硬件推理。后续,同样基于重参数化思路,通过对已有视觉 Transformers(ViTs)的机理进行深入分析,张祥雨提出了一种不同于 ViTs 的超大卷积核架构 RepLKNet,性能超越了主流的 ViTs,且结构简单易部署。
张祥雨现任大模型公司阶跃星辰首席科学家。与很多大模型公司选择以大语言模型为起点不同,该公司从图文交错式语料出发,直接训练原生图文多模态大模型。他提出了业内最早的图文生成理解一体化的多模态大模型架构之一——DreamLLM 多模态大模型框架。
基于该框架,阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V,与 Google 的首个同类模型 Gemini 1.0 几乎同时发布,多模态理解能力显著高于当时业界主流的视觉-语言分离式的架构。之后,他们还相继发布了万亿参数 MoE 基座大模型 Step-2、视频生成大模型 Step-Video、图文语音三模态理解大模型 Step-1o 以及推理模型 Step R-mini 等。
推荐阅读
欢迎大家加入DLer-大模型技术交流群!

👆 长按识别,邀请您进群!

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)