硅谷坐标 x 田渊栋深度访谈

3月5日
讀畢需時 6 分鐘

已更新：3月9日

“洪水马上来了，很多人还岁月静好。”

—— 田渊栋，前Meta AI研究总监

2026年2月28日，硅谷坐标主持人曹卿云在硅谷专访了田渊栋。田渊栋在Meta深耕11年，主导了强化学习、大模型推理与长上下文等多项前沿研究，近期刚刚以Co-founder身份开启新的创业旅程。本次对话涵盖大模型竞争、记忆与存储、推理前沿路线、Agents对社会的冲击等议题，以下是核心内容整理。

田渊栋

CMU机器人学博士。在Meta AI（FAIR）深耕11年，担任研究总监。他主导了开源围棋AI ELF OpenGo（单GPU击败职业棋手）、大模型长上下文扩展的奠基工作 Positional Interpolation 与 Attention Sinks（ICLR 2024，引用逾1,400次），以及隐空间推理前沿探索 Coconut，同期联席主导 Llama 4 Reasoning 方向，Google Scholar总引用超22,000次，h-index 74。近期以Co-founder身份开启新的创业旅程。

「本期核心观点」

1. 大模型竞争：蒸馏时代，领先优势正在缩短

田渊栋指出，自2022年底大模型爆发以来，竞争持续加剧，迭代速度已"接近人类生理极限"。这在很大程度上归因于蒸馏（Distillation）技术的普及：较弱模型通过学习更强模型的输出，能迅速逼近领先水平，导致技术窗口期被极度压缩。

大厂与初创公司的策略明显分化。谷歌等大厂利用现金流优势，通过发布Gemini解决未解数学难题等成果，持续昭示技术第一梯队的地位。初创公司则面临生存压力，必须证明模型够强以获融资，或像OpenAI那样在资金耗尽前找到商业模式（如广告植入）。田渊栋认为，这种你追我赶的态势在未来仍将持续。

2. 护城河排序：数据>Infra>算法>人才

在被问及未来3-5年的护城河时，⽥渊栋明确排序：数据最重要， Infra次之，算法和⼈才相对较弱。垂直领域或稀缺场景的数据是硬约束，没有数据就⽆法训练好模型。相⽐之下， Infra壁垒正在因AI辅助编程⽽降低——⽥渊栋坦⾔，使⽤AI后，他个⼈的编码效率在三个⽉内提升了⾄少⼗倍。

关于算法和⼈才，⽥渊栋直⾔"硅⾕⾥很难有⼀个秘密能保留很久"。新⽅案提出后，通过⼈才流动，往往2-3个⽉就传遍全⾏业。⽬前的算法改动多是"⼩修⼩补"，尚未出现颠覆性跳变，因此难以构成⻓期壁垒。算⼒⽅⾯，⼤⼚间差距不⼤，更多是⽐拼资⾦和使⽤效率。

3. 开源vs闭源：核武器威慑论

⽥渊栋坚定⽀持开源模型。他早在2023年就提出，地球上不能只有闭源模型。如果指数级增⻓的AI技术仅掌握在少数⼈⼿中，将导致严重的技术霸权和阶层分化。

他⽤"核武器"类⽐：当⼤部分⼈都能获得相当的模型能⼒时，就形成了"技术平权"或"威慑平衡"，避免了单极世界的滥⽤⻛险。虽然Meta从开源转向闭源是商业考量，但从技术⽣态平衡的⻆度，开源是必须存在的制衡⼒量。

4. 两种记忆：上下文与权重

⽥渊栋将记忆分为两类：⼀是" 上下⽂记忆" （ Context ），类似短期⼯作记忆；⼆是" 权重记忆"（Weights），类似⻓期深层记忆，通过预训练固化。上下⽂研究旨在低成本延⻓窗⼝。⽥渊栋团队的Position Interpolation⼯作证明，只需将位置编码除以2并微调，就能极低代价翻倍窗⼝，打破了必须重训⻓⽂本的迷思。

然⽽，真正的难题在于权重记忆：模型发布那⼀刻，其知识就冻结了。后训练微调只能局部优化，⽆法重塑世界观。因此，持续学习（Continue Learning） ——在推理中同步更新权重且不发⽣"灾难性遗忘"——是⽐单纯扩⻓窗⼝更关键的前沿⽅向。

5. 从背诵到顿悟：记忆研究的核心难题

⽥渊栋通过观察⼥⼉学数数发现： 3岁时孩⼦只是机械背诵，但4岁某天突然理解了数字⼤⼩关系，能⾃推两位数加减。这种内部表征的突然重组和逻辑"顿悟"，是⽬前AI尚未实现的。

现有机制（如Google的Nested Learning）本质仍是"查表"，缺乏⼈类"观其⼤略"的整体升华能⼒。如何让模型从死记硬背跃迁到结构性顿悟，是通向AGI的关键瓶颈，⽬前尚⽆突破性解法。

6. 未来AGI的记忆形态

关于AGI记忆形态，⽥渊栋倾向于"容量固定但质量升华"，⽽⾮单纯的容量⽆限扩⼤。单纯堆砌存储（如互联⽹）并不产⽣智慧。真正的智能在于压缩和抽象，将海量数据转化为权重中的"世界模型"。

下⼀代模型不仅要存得多，更要学得快、悟得透。理想状态是像聪明的孩⼦⼀样举⼀反三，⽽⾮像笨孩⼦⼀样需要反复教导才能掌握新任务。

7. Context Window为何没有天花板

Context Window的需求没有天花板，因为场景发⽣了质变：从"聊天"（⽇均10万字）变成了"让 Agent⾃主⼯作"（需处理整个代码库、多轮⼯具调⽤）。若希望AI连续⼯作⼀周不被打扰，上下⽂需求将轻松突破百万token。

⽬前Claude的分层Memory机制和MIT的Recursive Language Model都是过渡⽅案。虽然终极⽬标是智能压缩，但在达到之前，暴⼒扩⼤窗⼝仍是最直接有效的路径，因为上下⽂⻓度直接决定了Agent的持续作战能⼒。

8. 存储瓶颈：内存需求的指数级增⻓

随着模型参数从70B飙升⾄500B甚⾄1T（如DeepSeek、 Kimi K2），内存成为AI发展的最紧缺资源。单卡显存不⾜导致必须进⾏模型切⽚（Model Parallelism），由此产⽣的卡间通信延迟严重拖慢效率。

H200⽐H100抢⼿，根本原因就是⼤内存能减少卡数、降低延迟。加上多模态（4K图像）和Agent⻓时推理的需求，存储压⼒巨⼤。⽥渊栋提到，⾕歌、微软⾼管常驻⾸尔协调内存产能，正是这⼀物理瓶颈的真实写照。

9. 预训练Scaling Law的路径依赖

⽥渊栋认为Scaling Law依然有效，但边际递减明显。⼤⼚坚持这条路是因为"路径依赖"——团队基建已就绪，堆算⼒数据是最安全的策略。

但这种路径正⾯临电⼒、存储的物理限制。更关键的是，单纯Scaling⽆法解决"知识冻结"问题。预训练后的微调只能在局部优化，⽆法像预训练那样重塑认知。突破Scaling Law递减的关键，在于实现真正的持续学习。

10. 推理端的Scaling Law及其上界

针对Test-Time Scaling（增加推理时间提升效果），⽥渊栋提出：如很多研究揭示的那样，强化学习的能⼒上界被预训练锁死。强化学习本质是"搜索放⼤器"，从预训练提供的候选路径中找到正确解。

如果预训练根本没⻅过某类问题，连候选路径都不存在，强化学习就像在"空集"中搜索，永远找不到答案。因此，推理能⼒的提升必须建⽴在扎实的预训练基础之上。持续学习是唯⼀能突破这⼀认知边界的⽅法，但需解决"灾难性遗忘"难题。

11. 推理的未来：隐空间与并行推理

⽥渊栋看好两个推理⽅向。⼀是"隐空间推理"（如Coconut）：思维链不再是低效的语⾔序列，⽽是⾼维向量。⼀个向量可压缩表达⼀段推理，且能像量⼦叠加态⼀样同时编码多条路径，效率指数级提升。

⼆是"并⾏推理"：模仿⼈类多线程思考（如同时处理领导的5点要求），让模型学会拆解并⾏⼦任务，不再傻等串⾏步骤。配合Deep Conf等剪枝技术，这有望突破当前语⾔推理的串⾏瓶颈。

12. 幻觉的根源：Signal Space vs Null Space

⽥渊栋从数学⻆度解释幻觉：模型权重空间分为"信号空间"（有意义结构）和"零空间"（⽆意义噪声）。分布内数据抑制零空间，但分布外数据可能意外激活其中的噪声，导致幻觉。解决幻觉的根本在于打开⿊箱，理解微观层⾯的权重运作机制。

13. 小龙虾Agent的安全隐患

⽥渊栋试⽤⼩⻰虾Agent两⼩时后卸载，核⼼担忧是安全。他⽐喻道：这就像让⼀个握有你全部秘密（API Key、密码）的笨⼩孩出⻔办事，路上随时可能被⼏块糖（Prompt Injection）骗⾛你家地址。

这不是产品设计缺陷，⽽是当前LLM推理能⼒与被赋予权限的系统性错配。他建议⽤⼾在使⽤前务必读懂代码，明确Agent⼿⾥有什么钥匙，再决定给予多少信任。⼤规模部署此类Agent可能引发系统性安全事故。

14. Agent对社会的冲击

⽥渊栋预⾔， Agent将替代整个"事务性⼯作"类别（客服、秘书、数据录⼊等）。职业替代呈现"裹挟效应"：当同⾏⽤AI 24⼩时接单、⾃动规划路线时，你不使⽤就会因效率低下被系统性淘汰。

商业逻辑也将重构。 Agent没有欲望，只追最优解（性价⽐、速度），不被⼴告和视觉营销吸引。这意味着电商的流量漏⽃模型将失效，⽹站做得再花哨也没⽤。这种变⾰如洪⽔般袭来，⽽许多⾮AI从业者仍处于"岁⽉静好"的错觉中。

15. 教育下一代：目的性不可替代

⾯对AI冲击，⽥渊栋认为教育的核⼼应是培养"⽬的性"（Intent）。 AI是强⼤的执⾏⼯具，但"想做什么"、 "为什么要做"的初始动机是⼈类独有的。

艺术创作的价值在于创作者的内⼼冲动和经历，这是机器⽆法替代的灵魂。因此，教育应⿎励孩⼦追求⾃⼰真正想做的事。只要掌握了"⽬的性"， AI就是最好的放⼤器；若失去"⽬的性"，⼈将沦为⼯具的附庸。

🔒 田渊栋的下一站

田渊栋透露，他已加入一家Startup担任Co-founder，目前正在进行Series A融资。 "我们希望在一个关键的时间点正式宣布。"

🔒 待解密……