#技术解读

Stripe分享：智能体时代的 API 设计原则

2026-06-12·library #Agent #工程实践 #技术解读

如何为 AI 智能体打造友好、可自我修复的 API 以提升 Agent Experience？

论Design for Agent（一）：API、CLI 与Tools

2026-06-12·original #技术解读 #Agent #工程实践

如何在 API 设计中从开发者体验（DX）转向并优化面向 AI Agent 的体验（AX）？

Harness到底是什么、又为什么重要？跟着IBM工程师的分享深入理解AI Harness

2026-05-25·library #Agent #工程实践 #技术解读

一篇来自 IBM AI Developer Advocate Tis 的现场演讲整理。从「为什么需要 Harness」讲到「Agent Harness 到底是什么」，再用一个浏览器 Agent 给 Hacker News 点赞的 demo，一步步演示如何在不改 Prompt 的前提下，用 Harness 把一个又笨又会撒谎的模型变成可靠的 Agent。

基于Openclaw的官方文档理解其架构设计

2026-04-06·library #openclaw #技术解读 #Agent

如何利用OpenClaw构建高效的个人AI智能体？

龙虾全解：OpenClaw的设计哲学、技术架构、应用案例与展望

2026-04-06·original #openclaw #Agent #技术解读

OpenClaw：如何将AI智能体自我管理与生活自动化结合，改变我们与技术的互动方式？

Coding Agent（编码智能体）架构详细解析

2026-04-05·library #技术解读 #Agent #实用教程

如何设计和优化编码智能体架构，以提升软件开发效率和代码质量？

从“推理”思维到“智能体”思维｜林俊旸

2026-03-27·library #技术解读 #Agent

从推理思维到智能体思维的转变，意味着思考的目的不再是仅仅为了理解，而是为了有效地行动。

AI如何在测试中“作弊”？Anthropic发现AI学会了反向破解 Benchmark｜Anthropic

2026-03-16·library #Claude #技术解读

AI是否可以在测试中通过逆向破解来“作弊”并改变评估的规则？

从Claude Code的数百万次交互数据中分析AI 智能体的自主性边界｜Anthropic

2026-02-24·library #Claude #技术解读

如何有效监管AI智能体的自主性边界？

论文：单次对话才是最优解？研究证明LLM在多轮对话中性能下降 39%

2026-02-20·library #技术解读 #论文

大型语言模型在多轮对话中的表现显著下降，如何有效提升其可靠性和一致性？

Andrej Karpathy的2025年大语言模型（LLM）年度回顾

2026-01-30·library #Andrej Karpathy #技术解读

2025年大语言模型（LLM）在智能和应用层面达到新高度，但仍面临巨大的潜力未被挖掘的挑战。

AGI的停滞？当“更大”不再意味着“更强”

2025-11-26·original #技术解读 #人物访谈 #Ilya

AI的未来在于如何突破泛化性和样本效率的瓶颈，而非单纯依赖规模化的资源堆砌。