研究人员
深度求索AI研发核心人员
C:\TRUTHSEEK\RESEARCHERS> query --status
创始领导团队: 3位核心人员
架构团队: 4位专家
推理与对齐: 4位研究员
领域专家: 4位研究负责人
// 团队概述.TXT
深度求索AI于2023年由梁文锋创立,他此前建立了中国最成功的 量化对冲基金之一(幻方量化),后将资源转向基础AI研究。 团队秉持研究优先的理念,将科学发现置于商业应用之上。
研究团队围绕核心能力组织:模型架构、训练基础设施、推理系统、 对齐和领域专精。他们的开源路线——以MIT许可证发布所有模型—— 使深度求索成为全球AI研究进步的催化剂。
// 创始领导团队.DAT
深度求索AI和幻方量化的创始人兼首席执行官。量化对冲基金先驱,将利润重新投入基础AI研究。愿景:以好奇心而非盈利驱动,探索AGI的奥秘。
领导深度求索模型架构和训练方法论的整体研究方向。监管从基础模型到推理系统再到AGI追求的技术路线图。
管理深度求索的GPU集群基础设施、训练流水线和生产服务系统。设计了使V3实现惊人训练效率的分布式训练框架。
// 架构团队.DAT
DeepSeekMoE和多头潜在注意力架构的首席设计师。开创了细粒度专家分割方法,使671B参数中每个token仅激活37B。
多头潜在注意力的发明者。开发了低秩KV压缩技术,在128K上下文窗口中实现93.3%的缓存减少,同时保持完整注意力表达能力。
设计了无辅助损失负载均衡机制和专家路由策略。确保专家均匀利用而不降低训练信号质量。
设计了DualPipe并行策略和FP8混合精度训练框架。使2,048块H800 GPU集群在V3训练中实现了接近零的流水线气泡比率。
// 推理与对齐.DAT
领导了DeepSeek-R1项目。发现思维链推理通过纯强化学习(R1-Zero)自发涌现。开发了GRPO——组相对策略优化——消除了对评论模型的需要。
监管安全对齐、RLHF流水线和Constitutional AI方法。在开源发布理念与负责任的能力部署之间取得平衡。
开发了将R1能力迁移到更小模型(1.5B-70B)的推理蒸馏流水线。证明了紧凑模型可以通过知识转移实现前沿级推理。
设计和维护深度求索的内部评估基础设施。在AIME、MATH-500、Codeforces、GPQA和自定义推理测试套件上进行基准测试。
// 领域专家.DAT
领导DeepSeek-Coder系列开发。策展了涵盖338种编程语言的2万亿token代码训练语料库。在HumanEval、MBPP和LiveCodeBench上达到最先进水平。
领导DeepSeek-Math和DeepSeek-Prover项目。开创了工具集成数学推理和使用蒙特卡洛树搜索的Lean 4形式定理证明。
领导Janus多模态框架开发。构建统一的视觉-语言模型,将深度求索的推理能力扩展到图像理解和生成领域。
监管14.8万亿token的预训练数据流水线。管理多阶段去重、质量过滤、领域再均衡以及对代表性不足领域的合成数据生成。
// 研究理念.TXT
深度求索的运营理念与大多数AI实验室截然不同—— 将开放研究和科学好奇心置于竞争优势和商业变现之上。
- • 所有主要模型以MIT许可证开源发布
- • 每项架构创新都发布了详细的技术报告
- • 由幻方量化对冲基金利润资助的研究优先文化
- • 长期AGI追求优先于短期产品优化
这种方法使深度求索成为AI研究中一股独特的力量——一个资金充裕的 实验室将前沿AI开发视为科学事业而非产品竞赛, 与全球研究社区自由分享发现。
研究团队名册反映组织架构。个别研究人员跨多个项目参与贡献。
C:\TRUTHSEEK\RESEARCHERS> █