Hermes Agent走红之后,Agent真正缺的也许不是Skill

4月初,Hermes Agent迅速出圈。它主打的卖点很鲜明,Agent在完成任务后会把经验沉淀成Skill,之后遇到类似问题可以直接复用,并在反复使用中继续优化。这种“越用越强”的叙事,几乎击中了当下所有人对Agent的想象。

但热闹之下,一个更基础的问题反而容易被忽略,当前限制Agent落地的关键,真的是Skill不够聪明吗?

用"爱马仕"踢掉OpenClaw?但未解决最根本问题

文章指出,真正体验成熟的编程Agent产品,靠的往往不是Skill自我进化,而是扎实可靠的命令行工具体系。像文件搜索、代码定位、符号分析、内容读取这类原子操作,本质上都足够确定、调试成本低,而且几乎不消耗额外token。相比之下,Skill虽然更“性感”,却未必是最重要的地基。

把这个视角放到OpenClaw身上就更容易理解。用户最常抱怨的通常是两件事,一是token花费太高,二是长任务稳定性不够,经常中断或失联。继续往下拆,会发现它们常常来自同一个源头,也就是Agent被迫依赖脆弱工具,尤其是容易出错的浏览器自动化,去做本来应该由确定性工具完成的事情。

工具一旦不稳,Agent就只能反复观察、重试、重新规划。每一步虽然不一定致命,却都会持续烧token。于是稳定性差和成本高,实际上变成同一个问题的两面。Skill能提升Agent使用工具的熟练度,却不能把一个先天脆弱的工具直接变成高质量基础设施。

更进一步说,Skill本身仍然是自然语言资产,它依赖模型能力,也会受到模型版本变化影响。很多人以为强模型写出来的Skill可以无缝迁移给弱模型使用,但现实往往不是这样。命令行工具不同,它们更像执行层资产,只要输入一致,输出就可预期,和底层换了哪一个模型关系不大。

作者因此提出,当上下文管理足够好、底层工具足够强时,Skill的重要性会自然下降。真正值得补课的,是让更多高频流程CLI化,让Agent不必盯着网页一点点试错,而是通过结构化命令拿到结果。无论是网页、桌面应用还是移动端,只要流程足够稳定,理论上都可以被逐步压缩成原子工具。

文章最后给出的判断是,Agent系统的理想分层应当是CLI负责确定性执行,Skill负责经验编排,LLM负责语义判断。Hermes的出现说明Skill层正在快速补齐,但接下来更关键、也更不性感的战场,可能仍然在CLI层。

上一篇 2026/04/12 01:38
下一篇 2026/04/12 03:36

相关推荐

  • 班主任猥亵女生仅拘留10天调后勤,这样的处罚够了吗?

    有些事不说出来,心里堵得慌。 河南光山县,一名54岁班主任猥亵15岁女学生。处理结果是:行政拘留10天,降级后调离教学岗位到同一所学校的后勤部门。澎湃新闻有详细报道。 我们直觉上知…

    2026/04/15
    00
  • 文坛打假潮戳破了什么?从名家抄袭到出版业的专业溃败

    博主”抒情的森林”掀起的文坛打假风暴丝毫没有平息的迹象。在成功逼得86岁女作家杨本芬公开认错道歉之后,他又将矛头对准了文学界重量级人物贾平凹、其争议不断的诗…

    2026/04/15
    00
  • 联合航空提议与美国航空合并,全球最大航司或将诞生

    要落地,难度极大 美国联合航空首席执行官斯科特·柯比近日抛出了一个震动行业的提议:与老对手美国航空合并。不过,这一构想因触及敏感的反垄断红线,料将面临极其苛刻的监管审查。 假如两大…

    2026/04/15
    00
  • 信用卡为什么正在悄悄重返年轻人的钱包?

    有那么一段时间,这张卡被年轻人默默塞进了抽屉。而如今,它正悄悄回来了。 过去几年里,信用卡和年轻消费者之间的关系一度变得微妙尴尬。 移动支付已经顺滑到几乎无感的今天,信用卡显得有些…

    2026/04/15
    00
  • 江西一家民营医院突然倒闭,300多名医护前途未卜

    今年四月,坐落在江西乐平的天湖医院骤然宣布关停,一纸通知解聘了院内全部300余名员工。虽为民营机构,这家医院的综合水平、科室配置和运营规模在当地一度名列前茅。然而接连触犯医保服务协…

    2026/04/15
    00

发表回复

登录后才能评论