研究人员

深度求索AI研发核心人员

════════════════════════════════════════════════════════════════════════

C:\TRUTHSEEK\RESEARCHERS> query --status

创始领导团队: 3位核心人员

架构团队: 4位专家

推理与对齐: 4位研究员

领域专家: 4位研究负责人

────────────────────────────────────────────────────────────────────────

// 团队概述.TXT

深度求索AI于2023年由梁文锋创立,他此前建立了中国最成功的 量化对冲基金之一(幻方量化),后将资源转向基础AI研究。 团队秉持研究优先的理念,将科学发现置于商业应用之上。

研究团队围绕核心能力组织:模型架构、训练基础设施、推理系统、 对齐和领域专精。他们的开源路线——以MIT许可证发布所有模型—— 使深度求索成为全球AI研究进步的催化剂。

────────────────────────────────────────────────────────────────────────

// 创始领导团队.DAT

[LIANG WENFENG (梁文锋)]创始人兼首席执行官

深度求索AI和幻方量化的创始人兼首席执行官。量化对冲基金先驱,将利润重新投入基础AI研究。愿景:以好奇心而非盈利驱动,探索AGI的奥秘。

[首席研究官]核心团队

领导深度求索模型架构和训练方法论的整体研究方向。监管从基础模型到推理系统再到AGI追求的技术路线图。

[工程副总裁]核心团队

管理深度求索的GPU集群基础设施、训练流水线和生产服务系统。设计了使V3实现惊人训练效率的分布式训练框架。

────────────────────────────────────────────────────────────────────────

// 架构团队.DAT

[首席架构师]在任

DeepSeekMoE和多头潜在注意力架构的首席设计师。开创了细粒度专家分割方法,使671B参数中每个token仅激活37B。

[MLA研究负责人]在任

多头潜在注意力的发明者。开发了低秩KV压缩技术,在128K上下文窗口中实现93.3%的缓存减少,同时保持完整注意力表达能力。

[MOE系统负责人]在任

设计了无辅助损失负载均衡机制和专家路由策略。确保专家均匀利用而不降低训练信号质量。

[训练基础设施负责人]在任

设计了DualPipe并行策略和FP8混合精度训练框架。使2,048块H800 GPU集群在V3训练中实现了接近零的流水线气泡比率。

────────────────────────────────────────────────────────────────────────

// 推理与对齐.DAT

[推理研究负责人]在任

领导了DeepSeek-R1项目。发现思维链推理通过纯强化学习(R1-Zero)自发涌现。开发了GRPO——组相对策略优化——消除了对评论模型的需要。

[对齐研究负责人]在任

监管安全对齐、RLHF流水线和Constitutional AI方法。在开源发布理念与负责任的能力部署之间取得平衡。

[蒸馏负责人]在任

开发了将R1能力迁移到更小模型(1.5B-70B)的推理蒸馏流水线。证明了紧凑模型可以通过知识转移实现前沿级推理。

[评估负责人]在任

设计和维护深度求索的内部评估基础设施。在AIME、MATH-500、Codeforces、GPQA和自定义推理测试套件上进行基准测试。

────────────────────────────────────────────────────────────────────────

// 领域专家.DAT

[代码智能负责人]在任

领导DeepSeek-Coder系列开发。策展了涵盖338种编程语言的2万亿token代码训练语料库。在HumanEval、MBPP和LiveCodeBench上达到最先进水平。

[数学研究负责人]在任

领导DeepSeek-Math和DeepSeek-Prover项目。开创了工具集成数学推理和使用蒙特卡洛树搜索的Lean 4形式定理证明。

[多模态研究负责人]在任

领导Janus多模态框架开发。构建统一的视觉-语言模型,将深度求索的推理能力扩展到图像理解和生成领域。

[数据策展负责人]在任

监管14.8万亿token的预训练数据流水线。管理多阶段去重、质量过滤、领域再均衡以及对代表性不足领域的合成数据生成。

────────────────────────────────────────────────────────────────────────

// 研究理念.TXT

深度求索的运营理念与大多数AI实验室截然不同—— 将开放研究和科学好奇心置于竞争优势和商业变现之上。

  • • 所有主要模型以MIT许可证开源发布
  • • 每项架构创新都发布了详细的技术报告
  • • 由幻方量化对冲基金利润资助的研究优先文化
  • • 长期AGI追求优先于短期产品优化

这种方法使深度求索成为AI研究中一股独特的力量——一个资金充裕的 实验室将前沿AI开发视为科学事业而非产品竞赛, 与全球研究社区自由分享发现。

════════════════════════════════════════════════════════════════════════

研究团队名册反映组织架构。个别研究人员跨多个项目参与贡献。

C:\TRUTHSEEK\RESEARCHERS>