← 20VC
视频20VC· 06-13 · 13:59

OpenAI vs Anthropic vs 开源 | Token Maxing、AI 宿醉与即将到来的 ROI 清算

OpenAI vs Anthropic vs Open-Source | Token Maxing, AI Hangovers & The Coming ROI Reckoning

在 YouTube 打开
点击播放
20
20VC
YouTube

这条视频还没有中文字幕

该条目暂未提供中文字幕。本系统只对人工挑选的内容生成翻译。

挑中后 → 取 YouTube 字幕 → 精翻 → 此处切换为双语字幕

20VC × Factory 创始人 Matan Grinberg:AI 宿醉期与即将到来的 ROI 清算

AI 宿醉期与即将到来的 ROI 清算

2026 年 6 月 13 日,Harry Stebbings 在 20VC 录了一期 1 小时 25 分的长访谈。视频标题写得很大——《OpenAI vs Anthropic vs Open-Source|Token Maxing、AI 宿醉与即将到来的 ROI 清算》——但坐在对面的其实是一个人:Factory 的创始人兼 CEO Matan Grinberg。他不是科技圈出身,而是花了十二年想成为世界顶尖弦论物理学家的人,普林斯顿本科时就和大物理学家 Juan Maldacena 合写过论文,后来在伯克利读物理博士读到一半辍学。Harry 全程开玩笑说他长得像《心灵捕手》里的 Matt Damon。

这期值得整理,不是因为标题里那几个对立的公司名,而是因为 Grinberg 把当下所有混乱收束到了一条主线上:未来 24 个月,每一个 C-suite 都在反复算同一道题——token、美元、人,这三种资源该怎么分。 三阶段宿醉、开源模型的崛起、模型层和应用层互相绞杀、销售算不算脏活、博学者为什么回来了——所有话题都是这道分配题在不同切面上的投影。

原始视频:https://youtu.be/lgo_QbgV198

要点速览

一,每个 C-suite 未来两年的核心命题是资源分配,而且单位变了:过去比「这季度发了几个功能」,现在比「每一块钱、每一个 token、每一个人头,到底有没有把真正的业务指标往前推」。Grinberg 认为组织之所以臃肿,正是因为长期盯着中间指标而非结果。

二,AI 采用进入了「宿醉期」:第一阶段董事会逼问 CEO「我们的 AI 战略是什么」;第二阶段「不计代价上 AI」,用量被写进绩效考核(token maxing);第三阶段就是宿醉——账单送来,没人说得清 ROI。他举的真实例子:某 CIO 发现公司每月花几十万美元,是员工在拿 Opus 4.8 问「今天天气怎样」「我今天吃的宏量营养素是多少」。

三,80%–90% 的任务用开源模型就能干,但命门在那 10%:真正需要前沿模型的是「规划」这一步,也就是做决策的 token。它占用量少、却最贵最关键——和人类组织里「领导花最少的工时、做最不可逆的决定、拿最高的薪水」一模一样。

四,token 支出占开发者薪资的比例会暴涨且极度分化:Marc Benioff 说 Salesforce 一年在 Anthropic 上花 3 亿美元,约等于开发者薪资的 3.8%;Grinberg 判断三年后中位数会「和薪资同量级」,但个体差异极大——有人 0%,有人几千%。

五,所有人都在试图把别人变成不值钱的零件:模型层、应用层、基建层互相商品化(他用「微软组织架构图里各部门拿枪互指」那张梗图形容)。他的结论很冷静——「价值归属是一个随时间变化的现象」,没有谁能在稳态里独吞所有价值,今年是这家有定价权,明年换一拨。

六,「说得出一家销售或市场烂的传奇公司吗?你说不出」:他最有争议的观点是反硅谷的——研究不是金字塔尖、销售市场不是脏活,产品是「从客户第一次听到你名字,到十年后第十次续约」的整条旅程。当下融资狂热让大家不重视销售,等「重力回来」,萎缩的肌肉会让你站不起来。

七,博学者的时代回来了,工程师将不再写软件而是造「造软件的工厂」:AI 把人快速带到任一学科的前沿,达·芬奇、牛顿那种跨领域全才重新可能。他要招的不是奥赛冠军,而是能端到端扛业务结果的人。Factory 之所以叫「工厂」,就是因为未来工程师造的是特斯拉式的产线,而不是亲手拧每一颗螺丝。

八,关于泡沫、监管和大佬动机的硬话:他不信长期有基建泡沫;Anthropic 和 OpenAI 二选一上市他选 Anthropic(理由只是 OpenAI 太乱);并直言 Dario「我们要抢走你的工作」这句话「自私、不诚实、伤害了很多人」,本质是为募集天量资金服务——而 Zuckerberg、Demis Hassabis 从不这么说,因为他们从不缺钱。

要点速览

【1】每个 CEO 未来 24 个月都在算同一道题:token、美元、人怎么分

访谈一开口谈的是宏观——AI 会不会把过去两百年 2% 的 GDP 增速顶上去。Grinberg 的回答是肯定的,但他立刻把镜头拉回到一个更具体的层面:公司本质上是「围绕解决问题来组织的」。当每个人都能用同样的人手解决更多问题,或用更少的人解决同样多问题,资源配置就必须重新调整,而这个调整需要时间渗透。

他不愿意附和「10 倍工程师」这种说法,觉得「10 倍」到底指什么并不清楚——如果指写代码的量,那现在谁都能写十亿行屎代码。他更愿意用「承重个体」(load-bearing individuals)来描述:把这个人抽走,整个组织会塌;而有些人抽走了什么都不会发生。AI 这件杠杆,会让本来就高杠杆的人变得更高杠杆,让不会用杠杆的人在对比之下更不值钱。

由此引出他认为接下来两年最重要的管理命题:资源分配,而且单位从「人头」扩展到「美元 + token + 人」三元。 给领导者的建议是先想清楚「我们的核心能力到底是什么」,再据此分配。一家物流公司的核心能力不是软件开发,哪怕它养了一堆工程师——那只是手段。过去工程师被「这季度发几个功能」这种中间指标考核,组织因此越来越臃肿;现在终于被逼回到真正的业务指标:客户满意度、收入、市场份额。

Kirkland & Ellis(全球营收最高的律所)宣布五年投 5 亿美元自建 AI,是他用来敲打「核心能力」的反面例子:自研 AI 技术显然不是一家律所的核心能力。他甚至觉得这对 Harvey(律所 AI 工具公司)反而是好事——没有什么比自己动手做一遍更能让你意识到「这玩意儿原来这么难,还是交给专家吧」。那些喊「看,我早说很简单」的人,恰恰被这 5 亿美元的承诺打脸:真简单的话,谁会押 5 亿。

token 美元 人三向资源分配

【2】派对结束了:AI 采用的三阶段,现在卡在「宿醉」

这是全场最锋利的一段比喻。Grinberg 把企业采用 AI 分成三个阶段。第一阶段在几个月前:董事会冲 CEO 吼「你的 AI 战略是什么」,CEO 心里发慌「我哪知道」,于是层层下压「我们必须采用 AI」。第二阶段是「不计代价上 AI」——把 AI 使用量写进绩效考核(token maxing),逼所有人尽量多用。这个阶段来得比谁都预想的快,像一场通宵狂欢:喝酒、嗨到天亮、把所有 AI 都用上。

第三阶段就是宿醉:第二天去看账单,「我的天,我们花了这么多,我完全不知道 ROI 在哪,这到底对业务有没有帮助?」很多公司现在就卡在这儿。他讲了一个真实的 CIO 故事:对方发现公司每月在「员工拿 Opus 4.8 闲聊」上花掉几十万美元——问「今天怎么样」「我今天吃的宏量营养素是多少」「天气如何」。「我们不需要用人类智能的前沿去干这些事,何况有些根本和工作无关。」

这正是他认为「路由」(routing,按任务把请求分给最合适的模型)如此重要的原因。被问到会不会因此出现前沿模型用量的收缩,他说短期可能会有,但这是健康的——比起蒙着眼睛冲到某天突然失血要好得多。Uber 前一晚刚宣布给每人每月 1,500 美元的 AI 预算上限,他说这种「先放开、用量飙升、再惊慌设限」的剧情,他在自己几十家客户那里私下见过无数遍。

AI 采用的三阶段宿醉

【3】80% 的活开源模型就能干,但你不敢承认那 10% 才是命门

Harry 抛出一个尖锐的反问:如果 80%–90% 的任务都能用开源模型完成,那这不就是对「写代码」这件事最大的看空理由吗——等于把 80%–90% 的价值抽走了。

Grinberg 的回答把问题翻了个面:那 10%–20% 恰恰可能是最重要的 token,因为它们是决策 token。需要前沿模型的通常是「规划」环节。他用人类组织类比:如果你统计一家公司所有的人类工时,绝大多数工时花在收集数据和执行上,只有极少数小时是「在这里我们要做一个不可逆的战略决定」——而做这些决定的人,往往拿最高的薪水。所以前沿模型越来越贵、越来越往「超高推理」走是合理的:关键的规划步骤值得砸钱,但这并不意味着你大部分 token 都该流向它。规划做完、有了计划,落地实现交给开源模型通常就够好了。

他对开源(尤其中国开源)的态度很正面,称之为「重要的制衡」——它让企业能在「成本 / 质量 / 速度」这个三角里自由取舍,而好的资源分配恰恰要求你能站在三角的任意位置。他纠正了 Nebius 创始人「每隔几周出新模型」的说法:「你错了,是每隔几天,尤其看中国开源,一周三四个。」最终他预测模型发布会从「事件」变成「连续过程」——就像当年 GPT-2、3、3.5、4、4.1,越往后小数点越细,到某个时刻干脆不再发版本号,只剩一个「持续在变好的模型」。工程师已经有疲劳了,根本追不动每周的新模型——这也正是应用层(无论是 Factory 还是 Harvey)存在的理由:替你判断什么任务该用什么模型。

【4】所有人都在试图把对方变成「不值钱的零件」

被问到「什么信念会推翻你的判断」,他给出 Factory 的看空情形:如果某一家模型提供商显著强于所有其他家。Factory 的根基假设是所有模型大致旗鼓相当——这家擅长 review、那家擅长测试、另一家 Python 更强,每周都在波动,连专业人士都记不住此刻谁第一。一旦某家遥遥领先,企业可能直接 all-in 它,那对整个经济反而是该警惕的垄断。

他用「微软组织架构图各部门拿枪互指」的梗图,描述模型层、应用层、基建层此刻的真实关系:每个人都在试图把不是自己的那一层商品化。 Factory 自己是 model-agnostic(不绑定模型),所以乐于让 OpenAI、Anthropic、Google、微软互相施压、卷价格卷速度;模型公司则希望应用都变得「随手可造」,让产品的本体就是模型本身。但他强调一句很冷静的话:「价值归属是一个随时间变化的现象。」 没有哪个人在稳态里拿走全部价值——今年是这家有定价权,下一段时间换一拨人。「也许我说出了大家心照不宣的那部分:每个人都在试图把别人变成不值钱的零件。」

他也借此谈了应用层为何不会被模型公司轻易杀死:企业要安全、要可靠、要省事,但「省事」只在「世界上只有一个模型」时成立——当每周一个新模型、每次进企业都要走完整的合规流程,所谓的省事就不存在了。何况成本一旦失控、又拿不出 ROI,绑定单一前沿模型就更不划算。这把话题自然带回了他反复强调的命题:你要有能力在「成本 / 质量 / 速度」之间为每个任务做选择,而这正需要一个独立于模型的应用层。

模型层应用层基建层互相商品化

【5】「说得出一家销售烂的伟大公司吗?你说不出」

这是他自认为在所处赛道里最有争议的观点。硅谷有个常见的幻觉式鄙视链:研究是金字塔尖,工程师负责实现「虽然差点意思但也还行」,而销售、市场是「脏活」——「要是产品够好,它就该自己卖出去,我们就不用碰销售市场这些脏东西了」。他说这完全是妄想。

在 Factory,产品 = 从客户第一次听到你名字,到十年后第十次续约的整条旅程。 软件是其中很大一块,但市场投放、销售流程、解决方案工程同样是产品。工程师和销售挨着坐,没有「工程师角落 / 销售角落」;销售签下单子,工程师说「我们签了一单」;工程师上线功能,销售说「我们上线了功能」。整支队伍是一体的,没有一等公民和二等公民。他说这在湾区、在 coding/AI 圈「极其有争议,而且很离谱」。

他给出最锋利的那个比喻:当下没有重力——融资狂热里,模型公司排队求着把 token 卖给你,销售像在太空里漂浮,肌肉不用就会萎缩;等重力回来(gravity will come back),不重视销售市场的公司会发现自己所有肌肉都萎缩了,站都站不起来,根本没法竞争。 然后是那句金句:「说得出一家销售或市场烂的传奇公司吗?你说不出。」Harry 反将一军——「但我能说出一堆产品烂、销售市场极强的公司」,两人会心一笑没点名。

这也改变了「什么是好工程师」的定义。当工程师从「亲手做」变成「给一群智能体(droids)当提示者和管理者」,最好的工程师恰恰是那些不把销售市场当脏活、能端到端扛业务结果的人——一个延伸到销售、市场、客户赋能的「全栈」工程师。而硅谷过去最爱炫耀的那些东西(竞赛、奥赛、谁打字最快、谁背下最多语法细节)反而变得不重要。他不反对奥赛是「好指标」(拐杖、好信号,毕竟笨人赢不了竞赛),但在他眼里,真正的正信号是「你建过什么、你怎么端到端地拿下一件事的所有权」。

销售市场不是脏活

【6】博学者回来了:工程师不再写软件,而是造「造软件的工厂」

Grinberg 从小痴迷数学和物理,曾经嫉妒达·芬奇、欧拉、牛顿能当博学者——「因为他们那个年代各学科还很浅,一生之内能抵达多个学科的前沿」。而他成长的 2000、2010 年代,理论物理、弦论已经深到「你得花整整 50 年补完前人的文献,才有资格贡献一点新东西」,这让他极度抓狂。

AI 把这件事彻底反转:这些工具能极快地把你带到任一领域的前沿——你不会有别人那样的深度,但抵达前沿的速度前所未有。于是只要你擅长在约束中思考、擅长系统性思维、能在脑子里容纳不确定性并依然往前推,你就能同时在「开发者营销怎么做」「软件开发智能体的 token 缓存怎么优化」「怎么当一个出色的解决方案工程师」这些不相干的前沿上同时推进。博学者的时代回来了。 他在招聘里就是要找这种能当博学者的人。

由此延伸出一个他认为会越来越普遍的新角色:GM(总经理)式的前工程师——端到端拥有的不是「上线的功能」,而是「业务结果」。在 Factory 已经有人同时扛营销文案、产品指标、销售赋能。这远超传统工程师的边界,更像一个高能动性、更有创业气质的角色。他给学生的建议也是同一句:无论做什么都要全栈——做营销就从写文案、确保可发布、挑对时间发、再放大传播,全程参与,而不是「我只写文案,然后甩给设计、再甩给社媒团队」。

最后落到 Factory 这个名字的由来:未来的软件组织不再养「写软件的工程师」,而是养「造工厂的工程师」——这些工厂再去造软件。他每次都想到特斯拉的工厂:机械臂挥舞、流水线穿行,里头未必有很多人,但你清楚地知道,是人类设计了整套流程去最大化产量。新世界里,人类工程师不再亲手写大部分代码,而是负责「别让它只是技术上跑通、却堆出一座债务山」——他们搭的是这座软件工厂的脚手架。被问到「从在工厂里干活变成在工厂之上干活,会不会担心劳动力被取代」,他的回答是:短期会,长期不会。短期是对系统的冲击——成千上万人正在被激进裁员,这确实让他担忧;但长期看,世界上有海量本可以用软件解决、却还没被解决的问题(他点名痴呆症、制药研究),把工程人才重新分配到这些问题上是净的好事。他对「暂停 AI 发展」的论调相当不客气,认为那等于对痴呆症患者家属说「抱歉,你们再多忍受一阵这段关系吧,我们怕 AI」,既自私又有害。

博学者回归与造工厂的工程师

【7】从弦论到辍学:一场三小时的散步和一张「五个点」的支票

这是全场最个人、也最好看的一段。Grinberg 12 岁起痴迷物理,起点很荒诞——他是个差生,几何老师让他高中重修几何,「你觉得我需要重修几何?我证明给你看」,于是他在亚马逊下的人生第一单是代数二、三角、微积分一二三、微分方程、线性代数的教材,一个暑假自学完、用考试跳过所有课。他问爸爸「最难的数学是什么」,爸爸说弦论(严格说是物理不是数学),他就认定「那我要当弦论物理学家」,此后十二年只在乎数学和物理。普林斯顿读本科,为了能和著名物理学家 Juan Maldacena 合作(他是第一个和 Maldacena 合写论文的本科生),再到伯克利读博。

崩塌发生在伯克利:他突然意识到「我一直做这个,只是因为它难、只是因为有人说我做不到」,加上要给一群不在乎物理的 18 岁本科生讲课、教学评分只有 1/5,陷入存在主义危机。物理人的常规出路是量化金融,他面试了、几乎去纽约了,最后一秒被导师劝住「留在伯克利探索一下」。于是他第一次上了 CS 课,发现自己比 CS 学生还强(这让好胜的他很满足),直到上了一门当时叫「程序合成」(program synthesis,今天叫代码生成)的研讨课,被彻底「nerd-snipe」——「机器学习用在视频、音频、图像上我没感觉,但代码以创造自身为目的,这件事太根本了」。他意识到真正解决它要在工业界、要开公司,可他对创业一无所知,于是干了最朴素的事:在亚马逊下单 Peter Thiel 的《从 0 到 1》,上 YouTube 看「怎么开公司」。

转折点是他在一个斯坦福 VC 俱乐部播客里,认出一个名字——他在普林斯顿和 Maldacena 合写论文时引用过此人的论文。这位也是理论物理出身、卖掉一家公司套现十亿美元、如今是 Sequoia 的投资人,而且「在视频里看起来还挺正常、能保持眼神接触」(对理论物理学家而言这是极低的门槛)。他写了封邮件「嘿我也曾是物理学家,和 Juan 合过论文」,当天就收到回复、被请到 Sand Hill。原定 30 分钟的会变成了一场三小时的散步——两人对物理着迷的理由、离开物理的理由都惊人地相似。散步结束,对方说「你必须从博士退学,要么现在去 Twitter(马斯克刚接手、硬核,对简历好),要么开公司」。

他没在那场散步里推销自己的 demo(「不想用 pitch 弄脏这场对话」)。但第二天他去旧金山一个 hackathon,撞见一个同样来自普林斯顿、对这个问题同样着迷的人——后来的联合创始人 Eno Reyes,他形容那是「智识上的一见钟情」。两人接下来 72 小时做出一个更好的 demo,他打电话给那位投资人展示,对方却说「呃,还行吧」。他炸了「你他妈在开玩笑吗,这要改变世界」,对方只回「那你愿意全职做吗——愿意的话,退学,给我发张截图」。要知道他父母是从苏联移民到美国、几乎一无所有,他读博是父母最大的骄傲。但势头太猛,他还是退了学、发了截图,对方说「好,明天早上你要向 Sequoia 合伙人会议做汇报,准备好」。

他从没向风投合伙人会议汇报过,做了个「烂 deck」,甚至不知道对方是谁(Alfred、Pat、Roelof 都在场提问,他事后才知道这些人是谁),全程大概显得无比傲慢「这个我们轻松搞定、那个我们也能做」。第二天对方(Sean)打来电话「我们想给你开张支票」——100 万美元。Harry 替听众算账:那是 2023 年 4 月、远在大家谈智能体之前、连 Copilot 都没多少人用的时候,他们就在讲「全自动软件开发智能体」。Harry 拿支票条款打趣他「20% post(投后占 20%)」,按 Factory 最近一轮估值大约是 3 亿美元的仓位、还没算稀释。很多人劝他「拿着这个去 Sequoia 的名头到处比价,能拿更好条款」,但他拒绝了:「除了他没人会信我,我从没打过一天工,别的合伙人不会这么做。」对他而言,信任、忠诚、在不被看好时仍有人深信你,比价签上的数字重要得多。他还顺带谈了被「热门公司」追捧时投资人多擅长让你飘飘然(点名见过一位「老派」投资人,30 分钟后药效退去才反应过来「他得手了」),以及真正重要的是公司不热时、艰难时谁还在你身边。

【8】快问快答:Dario 那句「我们要抢你饭碗」为什么让他火大

最后是一连串快问快答,密度很高,挑几条最有信息量的:

代表性短摘与中文转述

一,"The world going forward, there is going to be nothing that no one can build.":他判断未来软件的护城河变了——过去是「我会做、你不会,所以你得付钱给我」;今后理论上任何软件人人都能造,问题从「能不能造」变成「值不值得你亲自造,还是外包给已经造好的人」。

二,"value accrual is a time-dependent phenomenon":模型层、应用层、基建层互相商品化,但没有谁在稳态独吞价值,定价权按时间段在各层之间转移。这是他化解「谁会吃掉谁」焦虑的核心框架。

三,"phase two was the debauchery... phase three is the hangover.":把企业 AI 采用比作通宵狂欢后的宿醉——第二阶段不计代价 token maxing,第三阶段对着账单发现没人说得清 ROI。

四,"Name a legendary company that has a shit sales or marketing team. You can't.":他反硅谷鄙视链的最强一击,配合「重力回来、萎缩的肌肉让你站不起来」的太空比喻。

五,"if you need FTEs to make the product work, you have a shit product.":驳斥靠堆驻场人力硬凑交付——FTE 只该用来加速消费,而不是替产品补窟窿。

六,"the bad case for humanity is when there's one that's really, really good.":他过去 12 个月改变最大的判断——至少四家前沿实验室会差不多好,而这正是人类之福,垄断才是最坏情形。

最后

这期最值得记的,不是任何一条预测,而是 Grinberg 把一切都还原成「资源分配」这个动作的能力——这是他物理学训练留下的真正痕迹:不关心 n=3 的特例,只问 n 维的一般解。token、美元、人三元分配,是他给这场混乱找到的那个「一般解」。它足够锋利,能解释宿醉期、能解释模型路由、能解释为什么 80% 的活该交给开源——但也正因为太锋利,需要警惕它被当成万能解。

第一处张力在他自己身上。他一边说 Factory 的护城河假设是「所有模型旗鼓相当」,一边又承认「如果某家遥遥领先,我们就完了」。也就是说,Factory 这门生意本质上是在做空「单一前沿模型胜出」——而过去三年 AI 的历史,恰恰是前沿不断被一两家短暂拉开又被追上的反复横跳。他赌的是「至少四家差不多好」会成为长期稳态,这是一个相当强的假设,而他把整个公司压在了上面。听众该追踪的信号很明确:未来 12 个月,前沿模型的领先差距是收敛还是扩大——这一个变量,几乎决定了 model-agnostic 应用层的生死。

第二处张力在他对大佬动机的批判里。他痛斥 Dario「抢饭碗」叙事是「为募资服务的自私话术」,这个判断很可能对;但他自己同样是一个在募资、在招人、在塑造叙事的创始人——「博学者回归」「海豹突击队」「EY 比初创还 agent-native」这些金句,同样是会让 LP 和候选人热血上头的叙事产品。他批判 Dario 用恐惧募资,自己则用「英雄主义 + 历史浪漫」招人;他敏锐地指出「最后驱动结果的是激励」,却没有把这把解剖刀对准自己的激励。这不是说他在撒谎——他大概率是真信的——而是提醒听的人:在场每个人的话,都该乘上一个「他想从你这里得到什么」的系数。 他自己亲口给了这把尺子(「每个人都在试图把别人变成不值钱的零件」),那就也用它来量他。

第三处,是那个被轻轻带过、却最沉的判断:短期劳动力替代「确实让我担忧」,成千上万人正在被激进裁员。他用「长期是净好事、世界上还有海量问题待解」迅速翻篇,逻辑没错,但「中间期」具体有多长、那些被裁的人怎么熬过这段错配,他没有答案,也没假装有。这恰恰是整期最诚实的地方——一个把一切都还原成资源分配的人,在「人」这个变量上,第一次没有给出干净的解。

最后:资源分配是他的一般解,但「人」这个变量他没有干净答案