
从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
备受瞩目的(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店盛大召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超过 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。作为全球机器学习技术大会的老朋友,深受广大参会者喜爱的新浪微博首席科学家及 AI 研发部负责人张俊林将再次出席,带来题为《从Deep
备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店盛大召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超过 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。
作为全球机器学习技术大会的老朋友,深受广大参会者喜爱的新浪微博首席科学家及 AI 研发部负责人张俊林将再次出席 ML-Summit 2025,带来题为《从DeepSeek R1 的复现看深度思考模型的未来》的精彩分享。
张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让开发者直呼“终于有人讲透技术本质”。
深耕 AI 多年,兼具学术视野与产业洞察
张俊林是中国中文信息学会理事,拥有中科院软件所博士学位。他不仅在新浪微博领导 AI 研发的前沿探索,此前还曾在阿里巴巴担任资深技术专家,负责新技术团队。作为《这就是搜索引擎:核心技术详解》与《大数据日知录:架构与算法》两本技术畅销书的作者,张俊林博士在自然语言处理、搜索技术、大数据及大模型领域拥有深厚的积累和广泛的影响力。
从 DeepSeek R1 复现出发,洞见深度思考模型未来
DeepSeek R1 的开源引发了学术界和工业界对其复现研究的热潮,也为探索更强大的“深度思考”模型提供了新的视角。在本次演讲中,张俊林将:
-
系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。
-
深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习与全场景对齐实现模型“深度思考”能力的跃迁。
-
探讨关键技术问题: 尝试解答一系列备受关注的核心问题,例如:强化学习(RL)的 Scaling Law 边界何在?影响 SFT 阶段蒸馏方法效果的关键因素是什么?如何科学地理解和解释 DeepSeek 团队提及的“Aha Moment”现象?
大模型时代,Scaling Law 依旧是核心驱动力。张俊林博士近期发表系列文章,深入探讨 Grok 3 背后的 Scaling Law 本质,以及对大模型未来发展的启示。他提出,即使 Grok 3 耗费大量算力,仍然遵循预训练阶段增大模型尺寸的“传统”做法,这种做法的性价比值得进一步思考。
此外,张俊林试图用 S 型曲线叠加来解释大模型预训练、后训练以及推理阶段 Scaling Law 的各种现象,引发业界广泛关注。他认为,理解 Scaling Law 的关键在于理解 S 型曲线的叠加。更多关于 Grok 3 与 Scaling Law 的深度思考,以及 “智能 S 曲线” 的精彩解读,请参考张俊林博士的最新文章:
对于渴望紧跟大模型前沿、理解深度思考模型核心机制与未来方向的听众而言,张俊林的分享无疑是一场不容错过的知识盛宴。
ML Summit 2025:共襄 AI 盛举,探索无限可能
2025 全球机器学习技术大会不仅汇聚了像张俊林博士这样的顶尖专家,更设有 12 大前沿技术专题和 AI 企业创新展区。这不仅是技术交流的殿堂,更是洞察趋势、链接生态、推动创新的平台。
我们诚邀全球 AI 从业者、研究者和爱好者齐聚上海,与张俊林博士等行业领袖面对面交流,共同把握 AI 发展的脉搏,探索技术的无限可能!期待在 ML Summit 2025 与您相会!
更多推荐
所有评论(0)