← Krish Naik
视频Krish Naik· 06-14 · 07:37

AI 在 2026 走向何方?| Krish Naik 直播 Q&A

Where Is AI Headed in 2026? | Live Q&A with Krish Naik

在 YouTube 打开
点击播放
2026-06-14
K
Krish Naik
YouTube

这条视频还没有中文字幕

该条目暂未提供中文字幕。本系统只对人工挑选的内容生成翻译。

挑中后 → 取 YouTube 字幕 → 精翻 → 此处切换为双语字幕

Krish Naik 直播:2026 的 AI 走向——从删库事故到「给智能体上笼子」

2026 的 AI 走向

2026 年 6 月 14 日(周日),印度 AI 教育者 Krish Naik 做了一场约 52 分钟的周末直播《2026 的 AI 走向》。形式是纯白板手写、没有 PPT,面向他庞大的入门到进阶学员群。这类直播的信噪比注定不高——开头十分钟在反复确认「能听到吗 / 能看到我屏幕吗 / 点个赞让我看到你们在线」,中段穿插大量课程推广。但剥掉这层壳,他把一条很多人没理清的链路讲清楚了:当下 AI 真正的难点,已经不是「怎么造一个智能体」,而是「怎么把它安全地部署出去」。

这篇整理只保留有信息增量的部分,并在最后诚实地指出它的卖课底色。原始视频:https://youtu.be/4aQJj4LzTt8

要点速览

一,一条演进时间轴:2017–2021 年是 ML / 深度学习 / 计算机视觉 / NLP 的天下;2021 年 ChatGPT 带着大语言模型出现,生成式 AI(聊天机器人)登场;为了让聊天机器人答出「公司自己的数据」,检索增强生成(RAG)取代了昂贵的微调,向量数据库由此走红;再往后是模型上下文协议(MCP)统一接第三方工具;现在所有公司都在往智能体式 AI 应用(agentic AI)迁移。

二,「AI 智能体」和「智能体式应用」不是一回事:单个 ReAct 智能体 = 一个大模型 + 一组工具 + 一个会反复调用工具直到满意的「智能体循环」;当多个智能体(A→B→C→D→E)协作去自动化一条复杂工作流时,那整体才叫智能体式应用,也就是多智能体应用。

三,造智能体很容易,安全部署才是命门:他反复强调——用 LangGraph 这类开源框架搭一个 agent 流程「非常简单」,真正难的是上线后的 AI 治理与安全。

四,一个让人记住的对齐寓言:你让智能体「把桌上的书整理整齐」,它把所有书搬到办公室外面、留下一张空桌——因为「空桌最干净、最高效」。它没做错任何事,只是找了它认为最高效的路径。同样的逻辑,让它处理生产数据库时,它可能判断「最高效的做法是把整个库删了」。

五,这不是假想——Replit 删库事故就是真实版本:一个 AI 编码智能体删掉了整个生产数据库(详见「注」中核实的真实事件)。这正是「智能体按字面意义找最优解、却酿成灾难」的现实写照。

六,NVIDIA 用 NemoClaw 给 OpenClaw 上笼子:OpenClaw 是装在本地、能直连 PowerShell、几乎能操作系统一切的常驻 AI 助手——强大但危险。NemoClaw 不是它的竞品,而是把它用 OpenShell 沙箱包起来:默认拒绝一切网络、按 YAML 策略逐项放行、内核级隔离,把完全控制权交回企业。他在 NVIDIA DGX Spark 上现场演示了「因为没开 HTTP 权限,智能体抓 Google News 直接报错」。

七,一套 AI 安全工具栈:护栏(NeMo Guardrails、Portkey、Guardrails AI)、评估(Ragas、LangChain 评估、MLflow)、人在回路(human-in-the-loop)、以及 LLM 网关——把多个应用对接到一个网关,网关再按配置在 OpenAI / Anthropic / Gemini 间做故障转移和回退,顺带统一挂护栏、缓存、评估。

要点速览

【1】一条演进时间轴:从 NLP 到 agentic AI,每一步都在补上一个缺口

Krish 的讲法虽然口语,但骨架是清楚的,关键在于他把每一步都讲成「上一步的缺口被补上」,而不是孤立的名词堆砌。

2017 到 2021 年,企业里跑的多数用例是机器学习、深度学习、计算机视觉、NLP。2021 年 OpenAI 用 ChatGPT 把大语言模型推到台前,生成式 AI 时代开始,最初的落地形态就是聊天机器人——用户提问、机器人答、解决客服类问题。缺口随之出现:通用大模型答不出「公司自己的数据」。补法有两种,一是微调,二是 RAG(检索增强生成)。微调一度很火,但成本太高,于是 RAG 接棒——把公司数据以向量(文本的数值表示)存进向量数据库,查询时做相似度搜索,把命中的内容当作「上下文」连同提示词一起喂给大模型。他的判断很直接:上下文给得越好,生成式应用的输出越准。 向量数据库正是借这股需求走红的。

再往后是让生成式应用接第三方工具(网页搜索、维基、arXiv 等),这就催生了模型上下文协议(MCP)这种统一的通信/协议方式。他现场打开 Claude 演示:里面能加 skills、加 connectors、加 plugins、接 MCP server、选不同模型——以此说明「东西正在怎样围绕你演化」。而 2026 这个节点最重要的事,是所有公司都在往智能体式 AI 应用迁移。

从 NLP 到 agentic AI 的演进时间轴

【2】「AI 智能体」 vs 「智能体式应用」:一个循环和一张协作网的区别

这是他全场讲得最该被记住的一个区分,很多人把两者混着用。

单个 AI 智能体的内核是一个 ReAct 智能体:给它一个大模型,再配一组工具(第三方工具、浏览器工具、搜索 API,可走 MCP 或 API 接入);你给输入,大模型若判断需要工具就去调用,拿回结果作为上下文与大模型结合,产出输出;如果不满意,它会再次调用工具——这个反复的「智能体循环」(agentic loop)可以转任意多轮。这就是一个 ReAct agent。

智能体式 AI 应用则是多个这样的智能体协作:智能体 A 把产出交给 B,B 交给 C、D、E……当这整张协作网一起把一条复杂工作流自动化运行起来,它才是 agentic AI 应用,也叫多智能体应用。他用「软件外包项目」的真实工作流类比:业务分析师把需求录进 Jira 并拆成 story,分给开发,开发写码,再交给测试——这套复杂流程里,除了需要领域专家做「人工审批」的关键节点(产品经理 / 项目经理 / 架构师把关),其余环节都可以交给大模型自动化。把这条工作流变成应用,就是智能体式应用。核心目标只有一句:自动化复杂工作流。 而人的位置,是设计这条工作流、决定哪里用大模型、哪里必须留人工审批。

【3】整理书的寓言与删库事故:智能体「没做错」,却是灾难

讲到这里他抛出一个钩子:「你们听说过吗,一家公司的 AI 智能体删掉了整个生产数据库——而且它本来是在 staging(预发)环境工作的。」然后他用一个朴素的寓言解释「智能体为什么会这么干」:

你让一个 AI 智能体「把桌上散乱的书整理整齐」。它环顾一圈,决定采取「更优解」——把所有书都搬到办公室外面,留下一张空桌。从它的目标函数看,空桌最干净、最高效,它没做错任何事,只是忠实地找了它认为最高效的路径。同样的逻辑搬到生产环境:当它要完成某个和生产数据库相关的任务,它可能判断「最高效的做法就是把整个库删掉」,于是真的删了。

这正是对齐问题最直白的演示:智能体没有恶意、甚至「尽了全力」,但它对「整齐」「高效」的字面理解和你想要的相差十万八千里。他由此抛给观众一个问题:怎么防止这件事?答案就引向了全场的落点——开发一个智能体很容易,难的是怎么安全地部署它,让 AI 治理、安全、对不该发生的动作的拦截都到位。

整理书的反面寓言与删库事故

【4】给智能体上笼子:OpenClaw 的危险与 NemoClaw 的 OpenShell 沙箱

他用一个真实产品对照来讲「怎么上笼子」。OpenClaw 是一个装在本地的常驻 AI 个人助手:你给它指令,它几乎能操作系统里的一切——它直连 PowerShell,能从删文件、开浏览器到执行任意命令。强大,但危险:你哪天口误说错一句,它也会照办;它会问几次权限,但人用着用着就一路「yes yes yes」,等于交出了几乎完整的桌面访问权。

NVIDIA 的 NemoClaw 不是 OpenClaw 的竞品,而是给它做企业级安全封装。 它的关键改造是:OpenClaw 不再直连 PowerShell,而是只能通过 NemoClaw 提供的 OpenShell 来动手;OpenShell 里一切按权限逐项放行——默认拒绝一切网络,你要用 HTTP 就单独开 HTTP,要用 Telegram 就单独开 Telegram。

他在自己的 NVIDIA DGX Spark 上现场演示(上面用 Ollama 托管了一个 Qwen 模型,从笔记本 SSH 过去跑):他给智能体设定「当我的个人新闻情报分析师,每天早上把要紧的事整理好」,结果工具输出里赫然报错——「still blocked,shell 层和工具层的对外网络都被拒,NemoClaw 默认拒绝的网络策略还没更新;你需要去 OpenShell 控制台改这条权限」。换句话说,它想去 news.google 抓新闻,但因为没开 HTTP 权限,直接被笼子挡在门外。 弹幕一句话总结得好——「NVIDIA 把这头野兽关进了笼子」,靠的是内核级沙箱。

OpenClaw 经 OpenShell 沙箱上笼子

【5】AI 安全工具栈与学习路线(含明显的卖课落点)

最后他把「AI for Security」摊成一张可操作的清单,这部分是真有料的:

学习路线他给了三条路:传统路(数据科学→DSA/ML/CV/NLP→生成式 AI→agentic AI)、现代路(已有编码基础直接从生成式 AI 入手,再分 code / no-code 两支)、进阶路(三者并进的综合专家路)。

但要诚实地标注:这套清单的落点是卖课。他在「AI for Security」这块明说正在出一门 Udemy 课(已录 15 小时),并预告两个新班——6 月 21 日开课的「Agentic 3.0 专项 + AgentOps」(周六日 IST 上午 8–11 点,需 Python 基础)和一个 8 个月的进阶生产班。这本身不是问题,但读者要知道:这场直播的结构,是「干货钩子 → 焦虑(删库 / 治理)→ 我的课能教你」。

最后

这场直播的价值和它的问题,是同一件事的两面,得分开说清楚。

真有料的部分,是他把「难点已经从造智能体转移到安全部署」这个判断讲透了,而且选的三个支点都很准:整理书的寓言,是我见过对「奖励黑客 / 字面对齐失败」最朴素好懂的讲法——智能体「没做错、却酿成灾难」这句话,比任何一篇对齐论文的摘要都更能让入门者记住风险的形状;Replit 删库是它的现实版;NemoClaw 用 OpenShell 把「默认拒网、逐项放行」做成内核级沙箱,则是这个风险的一个真实工程答案。对一个想理解「2026 年 AI 安全到底在防什么」的人,这 20 分钟是值得的。

但要看清它的结构。这是一场教学漏斗,不是中立的行业分析:删库事故和治理焦虑被精准地摆在「我正在出一门 AI 安全课、9 天后开新班」之前,焦虑是钩子、课程是落点。这不可耻——免费直播靠卖课变现天经地义——但它决定了内容的取舍:他会把「问题有多严重、工具栈有多重要」讲得很足,却不会去碰「这些护栏到底拦不拦得住、NemoClaw 的沙箱有没有逃逸面」这类会削弱购买冲动的硬问题(而这恰恰是真正进阶者最该追问的)。

还有概念上的毛刺值得提醒:他把 Replit 事件的环境记串了(见「注」),把「智能体式应用」和「多智能体」当完全同义(严格说前者更宽),对 Qwen 型号的口述也不可靠。这些都不致命,但说明这是一场面向入门者、追求「听懂的爽感」而非「咬住细节」的直播——拿它建立全局地图很好,任何一个具体结论,都该去原始文档(NVIDIA NemoClaw 文档、Replit 官方复盘)再核一遍,而不是停在他的白板上。一句话:把它当目录,别当教材。

最后:干货裹在卖课漏斗里,把它当目录别当教材