硅谷坐标 x 田渊栋深度访谈
- 3月5日
- 讀畢需時 6 分鐘
已更新:3月9日
“洪水马上来了,很多人还岁月静好。”
—— 田渊栋,前Meta AI研究总监
2026年2月28日,硅谷坐标主持人曹卿云在硅谷专访了田渊栋。田渊栋在Meta深耕11年,主导了强化学习、大模型推理与长上下文等多项前沿研究,近期刚刚以Co-founder身份开启新的创业旅程。本次对话涵盖大模型竞争、记忆与存储、推理前沿路线、Agents对社会的冲击等议题,以下是核心内容整理。

田渊栋
CMU机器人学博士。在Meta AI(FAIR)深耕11年,担任研究总监。他主导了开源围棋AI ELF OpenGo(单GPU击败职业棋手)、大模型长上下文扩展的奠基工作 Positional Interpolation 与 Attention Sinks(ICLR 2024,引用逾1,400次),以及隐空间推理前沿探索 Coconut,同期联席主导 Llama 4 Reasoning 方向,Google Scholar总引用超22,000次,h-index 74。近期以Co-founder身份开启新的创业旅程。
「本期核心观点」
1. 大模型竞争:蒸馏时代,领先优势正在缩短
田渊栋指出,自2022年底大模型爆发以来,竞争持续加剧,迭代速度已"接近人类生理极限"。这在很大程度上归因于蒸馏(Distillation)技术的普及:较弱模型通过学习更强模型的输出,能迅速逼近领先水平,导致技术窗口期被极度压缩。
大厂与初创公司的策略明显分化。谷歌等大厂利用现金流优势,通过发布Gemini解决未解数学难题等成果,持续昭示技术第一梯队的地位。初创公司则面临生存压力,必须证明模型够强以获融资,或像OpenAI那样在资金耗尽前找到商业模式(如广告植入) 。田渊栋认为,这种你追我赶的态势在未来仍将持续。
2. 护城河排序:数据>Infra>算法>人才
在被问及未来3-5年的护城河时, ⽥渊栋明确排序: 数据最重要, Infra次之, 算法和⼈才相对较弱。垂直领域或稀缺场景的数据是硬约束, 没有数据就⽆法训练好模型。 相⽐之下, Infra壁垒正在因AI辅助编程⽽降低——⽥渊栋坦⾔, 使⽤AI后, 他个⼈的编码效率在三个⽉内提升了⾄少⼗倍。
关于算法和⼈才, ⽥渊栋直⾔"硅⾕⾥很难有⼀个秘密能保留很久"。 新⽅案提出后, 通过⼈才流动,往往2-3个⽉就传遍全⾏业。 ⽬前的算法改动多是"⼩修⼩补", 尚未出现颠覆性跳变, 因此难以构成⻓期壁垒。 算⼒⽅⾯, ⼤⼚间差距不⼤, 更多是⽐拼资⾦和使⽤效率。
3. 开源vs闭源:核武器威慑论
⽥渊栋坚定⽀持开源模型。 他早在2023年就提出, 地球上不能只有闭源模型。 如果指数级增⻓的AI技术仅掌握在少数⼈⼿中, 将导致严重的技术霸权和阶层分化。
他⽤"核武器"类⽐: 当⼤部分⼈都能获得相当的模型能⼒时, 就形成了"技术平权"或"威慑平衡", 避免了单极世界的滥⽤⻛险。 虽然Meta从开源转向闭源是商业考量, 但从技术⽣态平衡的⻆度, 开源是必须存在的制衡⼒量。
4. 两种记忆:上下文与权重
⽥渊栋将记忆分为两类: ⼀是" 上下⽂记忆" ( Context ) , 类似短期⼯作记忆; ⼆是" 权重记忆"(Weights) , 类似⻓期深层记忆, 通过预训练固化。 上下⽂研究旨在低成本延⻓窗⼝。 ⽥渊栋团队的Position Interpolation⼯作证明, 只需将位置编码除以2并微调, 就能极低代价翻倍窗⼝, 打破了必须重训⻓⽂本的迷思。
然⽽, 真正的难题在于权重记忆: 模型发布那⼀刻, 其知识就冻结了。 后训练微调只能局部优化, ⽆法重塑世界观。 因此, 持续学习(Continue Learning) ——在推理中同步更新权重且不发⽣"灾难性遗忘"——是⽐单纯扩⻓窗⼝更关键的前沿⽅向。
5. 从背诵到顿悟:记忆研究的核心难题
⽥渊栋通过观察⼥⼉学数数发现: 3岁时孩⼦只是机械背诵, 但4岁某天突然理解了数字⼤⼩关系, 能⾃推两位数加减。 这种内部表征的突然重组和逻辑"顿悟", 是⽬前AI尚未实现的。
现有机制(如Google的Nested Learning) 本质仍是"查表", 缺乏⼈类"观其⼤略"的整体升华能⼒。 如何让模型从死记硬背跃迁到结构性顿悟, 是通向AGI的关键瓶颈, ⽬前尚⽆突破性解法。
6. 未来AGI的记忆形态
关于AGI记忆形态, ⽥渊栋倾向于"容量固定但质量升华", ⽽⾮单纯的容量⽆限扩⼤。 单纯堆砌存储(如互联⽹) 并不产⽣智慧。 真正的智能在于压缩和抽象, 将海量数据转化为权重中的"世界模型"。
下⼀代模型不仅要存得多, 更要学得快、 悟得透。 理想状态是像聪明的孩⼦⼀样举⼀反三, ⽽⾮像笨孩⼦⼀样需要反复教导才能掌握新任务。
7. Context Window为何没有天花板
Context Window的需求没有天花板, 因为场景发⽣了质变: 从"聊天"(⽇均10万字) 变成了"让 Agent⾃主⼯作"(需处理整个代码库、 多轮⼯具调⽤) 。 若希望AI连续⼯作⼀周不被打扰, 上下⽂需求将轻松突破百万token。
⽬前Claude的分层Memory机制和MIT的Recursive Language Model都是过渡⽅案。 虽然终极⽬标是智能压缩, 但在达到之前, 暴⼒扩⼤窗⼝仍是最直接有效的路径, 因为上下⽂⻓度直接决定了Agent的持续作战能⼒。
8. 存储瓶颈: 内存需求的指数级增⻓
随着模型参数从70B飙升⾄500B甚⾄1T(如DeepSeek、 Kimi K2) , 内存成为AI发展的最紧缺资源。 单卡显存不⾜导致必须进⾏模型切⽚(Model Parallelism) , 由此产⽣的卡间通信延迟严重拖慢效率。
H200⽐H100抢⼿, 根本原因就是⼤内存能减少卡数、 降低延迟。 加上多模态(4K图像) 和Agent⻓时推理的需求, 存储压⼒巨⼤。 ⽥渊栋提到, ⾕歌、 微软⾼管常驻⾸尔协调内存产能, 正是这⼀物理瓶颈的真实写照。

9. 预训练Scaling Law的路径依赖
⽥渊栋认为Scaling Law依然有效, 但边际递减明显。 ⼤⼚坚持这条路是因为"路径依赖"——团队基建已就绪, 堆算⼒数据是最安全的策略。
但这种路径正⾯临电⼒、 存储的物理限制。 更关键的是, 单纯Scaling⽆法解决"知识冻结"问题。 预训练后的微调只能在局部优化, ⽆法像预训练那样重塑认知。 突破Scaling Law递减的关键, 在于实现真正的持续学习。
10. 推理端的Scaling Law及其上界
针对Test-Time Scaling(增加推理时间提升效果) ,⽥渊栋提出:如很多研究揭示的那样, 强化学习的能⼒上界被预训练锁死。 强化学习本质是"搜索放⼤器", 从预训练提供的候选路径中找到正确解。
如果预训练根本没⻅过某类问题, 连候选路径都不存在, 强化学习就像在"空集"中搜索, 永远找不到答案。 因此, 推理能⼒的提升必须建⽴在扎实的预训练基础之上。 持续学习是唯⼀能突破这⼀认知边界的⽅法, 但需解决"灾难性遗忘"难题。
11. 推理的未来:隐空间与并行推理
⽥渊栋看好两个推理⽅向。 ⼀是"隐空间推理"(如Coconut) : 思维链不再是低效的语⾔序列, ⽽是⾼维向量。 ⼀个向量可压缩表达⼀段推理, 且能像量⼦叠加态⼀样同时编码多条路径, 效率指数级提升。
⼆是"并⾏推理": 模仿⼈类多线程思考(如同时处理领导的5点要求) , 让模型学会拆解并⾏⼦任务,不再傻等串⾏步骤。 配合Deep Conf等剪枝技术, 这有望突破当前语⾔推理的串⾏瓶颈。
12. 幻觉的根源:Signal Space vs Null Space
⽥渊栋从数学⻆度解释幻觉: 模型权重空间分为"信号空间"(有意义结构) 和"零空间"(⽆意义噪声) 。 分布内数据抑制零空间, 但分布外数据可能意外激活其中的噪声, 导致幻觉。 解决幻觉的根本在于打开⿊箱, 理解微观层⾯的权重运作机制。

13. 小龙虾Agent的安全隐患
⽥渊栋试⽤⼩⻰虾Agent两⼩时后卸载, 核⼼担忧是安全。 他⽐喻道: 这就像让⼀个握有你全部秘密(API Key、 密码) 的笨⼩孩出⻔办事, 路上随时可能被⼏块糖(Prompt Injection) 骗⾛你家地址。
这不是产品设计缺陷, ⽽是当前LLM推理能⼒与被赋予权限的系统性错配。 他建议⽤⼾在使⽤前务必读懂代码, 明确Agent⼿⾥有什么钥匙, 再决定给予多少信任。 ⼤规模部署此类Agent可能引发系统性安全事故。
14. Agent对社会的冲击
⽥渊栋预⾔, Agent将替代整个"事务性⼯作"类别(客服、 秘书、 数据录⼊等) 。 职业替代呈现"裹挟效应": 当同⾏⽤AI 24⼩时接单、 ⾃动规划路线时, 你不使⽤就会因效率低下被系统性淘汰。
商业逻辑也将重构。 Agent没有欲望, 只追最优解(性价⽐、 速度) , 不被⼴告和视觉营销吸引。 这意味着电商的流量漏⽃模型将失效, ⽹站做得再花哨也没⽤。 这种变⾰如洪⽔般袭来, ⽽许多⾮AI从业者仍处于"岁⽉静好"的错觉中。
15. 教育下一代:目的性不可替代
⾯对AI冲击, ⽥渊栋认为教育的核⼼应是培养"⽬的性"(Intent) 。 AI是强⼤的执⾏⼯具, 但"想做什么"、 "为什么要做"的初始动机是⼈类独有的。
艺术创作的价值在于创作者的内⼼冲动和经历, 这是机器⽆法替代的灵魂。 因此, 教育应⿎励孩⼦追求⾃⼰真正想做的事。 只要掌握了"⽬的性", AI就是最好的放⼤器; 若失去"⽬的性", ⼈将沦为⼯具的附庸。
🔒 田渊栋的下一站
田渊栋透露,他已加入一家Startup担任Co-founder,目前正在进行Series A融资。 "我们希望在一个关键的时间点正式宣布。"
🔒 待解密……


留言