██████╗██████╗ ███████╗██╗    ██╗    ██████╗  ██████╗ ███████╗████████╗███████╗██████╗
██╔════╝██╔══██╗██╔════╝██║    ██║    ██╔══██╗██╔═══██╗██╔════╝╚══██╔══╝██╔════╝██╔══██╗
██║     ██████╔╝█████╗  ██║ █╗ ██║    ██████╔╝██║   ██║███████╗   ██║   █████╗  ██████╔╝
██║     ██╔══██╗██╔══╝  ██║███╗██║    ██╔══██╗██║   ██║╚════██║   ██║   ██╔══╝  ██╔══██╗
╚██████╗██║  ██║███████╗╚███╔███╔╝    ██║  ██║╚██████╔╝███████║   ██║   ███████╗██║  ██║
 ╚═════╝╚═╝  ╚═╝╚══════╝ ╚══╝╚══╝     ╚═╝  ╚═╝ ╚═════╝ ╚══════╝   ╚═╝   ╚══════╝╚═╝  ╚═╝

研究人员

深度求索AI研发核心人员

════════════════════════════════════════════════════════════════════════

C:\TRUTHSEEK\RESEARCHERS> query --status

创始领导团队: 3位核心人员

架构团队: 4位专家

推理与对齐: 4位研究员

领域专家: 4位研究负责人

────────────────────────────────────────────────────────────────────────

// 团队概述.TXT

深度求索AI于2023年由梁文锋创立，他此前建立了中国最成功的量化对冲基金之一（幻方量化），后将资源转向基础AI研究。团队秉持研究优先的理念，将科学发现置于商业应用之上。

研究团队围绕核心能力组织：模型架构、训练基础设施、推理系统、对齐和领域专精。他们的开源路线——以MIT许可证发布所有模型—— 使深度求索成为全球AI研究进步的催化剂。

// 创始领导团队.DAT

[LIANG WENFENG (梁文锋)]创始人兼首席执行官

深度求索AI和幻方量化的创始人兼首席执行官。量化对冲基金先驱，将利润重新投入基础AI研究。愿景：以好奇心而非盈利驱动，探索AGI的奥秘。

[首席研究官]核心团队

领导深度求索模型架构和训练方法论的整体研究方向。监管从基础模型到推理系统再到AGI追求的技术路线图。

[工程副总裁]核心团队

管理深度求索的GPU集群基础设施、训练流水线和生产服务系统。设计了使V3实现惊人训练效率的分布式训练框架。

// 架构团队.DAT

[首席架构师]在任

DeepSeekMoE和多头潜在注意力架构的首席设计师。开创了细粒度专家分割方法，使671B参数中每个token仅激活37B。

[MLA研究负责人]在任

多头潜在注意力的发明者。开发了低秩KV压缩技术，在128K上下文窗口中实现93.3%的缓存减少，同时保持完整注意力表达能力。

[MOE系统负责人]在任

设计了无辅助损失负载均衡机制和专家路由策略。确保专家均匀利用而不降低训练信号质量。

[训练基础设施负责人]在任

设计了DualPipe并行策略和FP8混合精度训练框架。使2,048块H800 GPU集群在V3训练中实现了接近零的流水线气泡比率。

// 推理与对齐.DAT

[推理研究负责人]在任

领导了DeepSeek-R1项目。发现思维链推理通过纯强化学习（R1-Zero）自发涌现。开发了GRPO——组相对策略优化——消除了对评论模型的需要。

[对齐研究负责人]在任

监管安全对齐、RLHF流水线和Constitutional AI方法。在开源发布理念与负责任的能力部署之间取得平衡。

[蒸馏负责人]在任

开发了将R1能力迁移到更小模型（1.5B-70B）的推理蒸馏流水线。证明了紧凑模型可以通过知识转移实现前沿级推理。

[评估负责人]在任

设计和维护深度求索的内部评估基础设施。在AIME、MATH-500、Codeforces、GPQA和自定义推理测试套件上进行基准测试。

// 领域专家.DAT

[代码智能负责人]在任

领导DeepSeek-Coder系列开发。策展了涵盖338种编程语言的2万亿token代码训练语料库。在HumanEval、MBPP和LiveCodeBench上达到最先进水平。

[数学研究负责人]在任

领导DeepSeek-Math和DeepSeek-Prover项目。开创了工具集成数学推理和使用蒙特卡洛树搜索的Lean 4形式定理证明。

[多模态研究负责人]在任

领导Janus多模态框架开发。构建统一的视觉-语言模型，将深度求索的推理能力扩展到图像理解和生成领域。

[数据策展负责人]在任

监管14.8万亿token的预训练数据流水线。管理多阶段去重、质量过滤、领域再均衡以及对代表性不足领域的合成数据生成。

// 研究理念.TXT

深度求索的运营理念与大多数AI实验室截然不同—— 将开放研究和科学好奇心置于竞争优势和商业变现之上。

• 所有主要模型以MIT许可证开源发布
• 每项架构创新都发布了详细的技术报告
• 由幻方量化对冲基金利润资助的研究优先文化
• 长期AGI追求优先于短期产品优化

这种方法使深度求索成为AI研究中一股独特的力量——一个资金充裕的实验室将前沿AI开发视为科学事业而非产品竞赛，与全球研究社区自由分享发现。

研究团队名册反映组织架构。个别研究人员跨多个项目参与贡献。

C:\TRUTHSEEK\RESEARCHERS> █