博亚盘口

博亚盘口

博亚体育app中国官网入口 澳洲放羊大叔引爆 AI 编程立异!Claude Code 急推 goal 方法,不干完不许停

发布日期:2026-05-13 14:00 来源:未知 作者:admin 浏览次数:

博亚体育app中国官网入口 澳洲放羊大叔引爆 AI 编程立异!Claude Code 急推 goal 方法,不干完不许停

澳洲牧羊大叔唾手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

一醒觉来,Claude Code 又更新!

为了让 Claude 抓续职责直到任务完成,Claude Code 最近推出的新功能:/goal 。

你只有设定条目,Claude 不完成任务它毫不放肆!

伸开剩余90%

用过 AI 编程器具的东说念主都懂,这到底多进军!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文献,瞬息停驻来问你「接下来需要我作念什么?」

不是,bug 你这还没修完呢啊!

Agent 越来越灵巧,写代码越来越快,但「从新到尾把一件事干完」这件事,到 2026 年头都莫得一家能作念到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 惩办了。

while :; do cat PROMPT.md | claude-code --continuedone

他把它定名为 Ralph Loop,请安《辛普森一家》里阿谁永久搞不清气象但从不放置的小孩 Ralph Wiggum。

逻辑极其奸猾,无穷轮回,反复把消失个 prompt 喂给 Agent。经由写在文献系统和 Git 历史里,险阻文满了就开新实例,读文献接着干。

原始,不优雅,但异常灵验。

灵验到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,殊途同归地把这三行 bash 写进了官方家具。

这一刻,总计东说念主都显着了一件事 ——

通用东说念主工智能的临门一脚,可能不是更灵巧的模子,而是「把事作念完」的模子。

换句话说,AI 编程的中枢战场正在从「生成代码」转向「闭环录用」。

11 天,三条线,消失个绝顶

4 月 30 日,OpenAI 的 Codex 最初上线 / goal。

Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。消失个大叫。消失个功能。

但达成旅途,差了十万八沉。

澳洲幸运8官方网站入口

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

Codex:把观点存成一条数据库纪录

OpenAI 是三家里起初出手的,决策也最自便。

在 Codex 里,/goal 是一个抓久化的职责流对象,存在土产货的 app-server 状态层里。

关掉末端、合上札记本、以至重启系统,观点都不会丢。下次绽开 Codex,自动接上。

模子通过结构化的 update_goal 器具呈报经由状态,token 预算花费时触发「软着陆」而非硬停。

有东说念主用这个功能指挥跑了 14 个小时,中间暂停 5 小时去寝息,回想 Codex 从断点续跑,把一个缔造驱动名目作念收场。

工程化,干净,但克制。

Hermes Agent:一个东说念骨干不完,博亚(中国)体育app那就上一个团队

Hermes Agent 的算计最大。

在这里,/goal 仅仅冰山一角。真确的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队联结问题。

看板的底层是土产货 SQLite,抓久化存储,跨重启不丢。

你在上头创建一个任务卡片,Hermes 会平直把它拆成多个子任务,分拨给不同的 Agent worker。每个 worker 是一个零丁的 OS 经由,有我方的身份、模子设置和职责目次。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的观点锁定(Ralph loop),看板管的是多个 Agent 之间的任务诊治。一个纵向深远,一个横向铺开。

终末,是五层防烂尾机制。

第一层,心跳检测。每个 worker 如期向看板报到,讲明我方还辞世。

第二层,僵尸回收。worker 超时没反应?系统自动判定亏损,回收它手上的任务再行分拨。macOS 上还有成心的达尔文僵尸检测逻辑。

第三层,退出遏止。worker 没完成任务就退出了?系统自动把它标志为 blocked,不让它再接新活,退缩「摸鱼型 Agent」反复领任务又不作念。

第四层,幻觉遏止。这是最狠的一层。AI 说「我作念收场」不算数,系统会考据它践诺产出的代码是否确切落盘了。Agent 说我方创建了一个文献但践诺上莫得?收拢,回滚,重来。

第五层,重试预算。每个任务有零丁的 max_retries,最多重试 N 次,提升就上报东说念主类。皆备不会无穷轮回到死机。

Claude Code:作念事的东说念主和验收的东说念主,不可是消失个

Anthropic 是三家里终末出手的,但决策最奥秘。

践诺上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成条目(比如「test / auth 目次下总计测试通过且 lint 无报错」),Claude 就开动干活。

要害策画在验收设施。每干完一轮,系统不让 Claude 我方判断「我作念收场莫得」。

它把对话纪录和你的完成条目沿途发给一个零丁的小模子(默许是 Haiku),让这个小模子来裁判。

小模子要是以为没完成,就需要复返一个具体事理(比如「test_login.py还有 2 个 failure」)。然后这个事领路被注入 Claude 下一轮的险阻文,指挥它接着干。

要是小模子认为完成了,观点就会自动捣毁,任务扫尾。

值得一提的是,这个裁判模子不调用任何器具,不读文献,不跑大叫。它只看 Claude 在对话里产出的内容。

是以,你的完成条目必须是 Claude 在对话中能讲明的东西。

它最长救济 4000 字符,因此你不错写得很细。

以至,还不错在条目里加治理,比如「不修改其他测试文献」「20 轮内完成不然住手」等等。

决赛进行时:职责流进口

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了双方的模子,同期亦然 DeepSeek V4 等模子的主力分发渠说念。

三条旅途,恰巧袒护了 ASI 决赛的三个生态进口。

而他们争的,亦然消失样东西 —— 职责流。

谁的 Agent 先闪开采者养成「设完观点就走开」的风俗,谁就锁死了职责流进口。

因为风俗一朝酿成,搬动资本是指数级的。

你不会纵欲离开一个一经跑通了看板诊治、断点续传、checkpoint 回滚的 Agent 基础设施。

一个看似很小的 / goal 大叫,背后卡的是整条 Agent 职责流的护城河。

参考尊府:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog博亚体育app中国官网入口

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

发布于:山东省