从Bash工具开始理解Agent

Created time

Apr 2, 2026 05:50 PM

Bash 工具是一类简单的命令行实用工具。你可以“让电脑去运行它们”，从而让智能体能够可靠地在杂乱文本中进行搜索、清洗与计算，而不是把所有事情都放在模型的“脑内”完成。

Thariq 说：“我们发现 bash 工具/代码生成能让你处理更多长尾用例，并实现一些涌现式功能，比如通过技能（skills）实现上下文的懒加载。”

他通过一个例子很直白地展示了有/无Bash工具的情况下，AI处理同一个问题的区别：

想象一下，用户问：“我这周在网约车上花了多少钱？”

如果使用工具调用（tool calls），你必须先获取邮件，然后让模型从这些邮件中找出答案。但如果你获取了约 100 封邮件，模型将很难从中找到所需数据。

有了 bash 工具，你可以将这些结果保存到文件中，然后再进行搜索。

这让模型能够：

LLM 本质上是概率预测模型，不擅长精确的算术运算。

事实： 让 AI 算 $12.45 + 33.10 + 9.99，其实是可能出错的，但让 AI 写一段 awk '{sum += $1} END {print sum}' 的正确率极高。

图中右侧展示了 Bash 处理非结构化数据的威力。

价值： 用户或开发者可以查看这段 Bash 脚本，核对正则表达式是否正确，核对搜索条件是否包含所有平台（如 uber.com OR lyft.com）。这让 AI 的决策过程从“黑盒”变成了“白盒”。

实际上，Bash 只是一个经典且高效的系统交互接口，这种“用程序驱动任务”的理念完全可以推及到 Python、SQL 等任何脚本语言或工具构建上。

总而言之，核心逻辑不再是让大模型在纯文字推理中“空转”，而是利用 Agent 的编排能力，去设计、驱动、甚至即时构建所需的工具，再通过这些具有确定性逻辑的工具去交付结果。这正是目前 Agent 演进的必然趋势，也是 Openclaw 这种项目表现震撼的核心原因。

此外，这也解释了为什么 Claude 极早地押注 Coding 能力：因为代码能力是 Agent 的“元能力”。代码能力越强，意味着 Agent 能够为自己打造的“数字手脚”就越完备、越可靠，从而在虚拟世界无所不能。