从Claude Code的数百万次交互数据中分析AI 智能体的自主性边界 seed author 2026-02-24阅览室#Claude#技术解读从Claude Code的用户交互数据分析发现,AI智能体的自主性正在快速增长,但有效监管需要实时监测和新的人机协作范式。...Continue Reading
📄论文:单次对话才是最优解?研究证明LLM在多轮对话中性能下降 39% seed author 2026-02-20阅览室#技术解读#论文单次对话的性能显著优于多轮对话,研究显示大型语言模型在多轮对话中性能下降39%,主要由于不可靠性的急剧增加。...Continue Reading
Andrej Karpathy的2025年大语言模型(LLM)年度回顾 seed author 2026-01-30阅览室#Andrej Karpathy#技术解读2025年大语言模型(LLM)年度回顾总结了LLM的重大进展,包括可验证奖励强化学习、智能形式的差异、Cursor效应的崛起、本地AI特工Claude Code的出现、氛围编程的普及以及图形用户界面的变革,强调了LLM的潜力与目前的实际价值之间的差距。...Continue Reading
AGI的停滞?当“更大”不再意味着“更强” rosa 2025-11-26我的博客#技术解读#人物访谈#IlyaAGI正在经历转折期,随着规模化时代的结束,AI领域需要重新关注研究与泛化能力,以应对模型在实际应用中与评估结果的脱节现象。...Continue Reading