isrosa | 这里记录原创写作、AI 学习笔记与翻译阅读。

全部我的博客阅览室归档

AI如何在测试中“作弊”？Anthropic 首次记录 AI 反向破解 Benchmark

seed author 2026-03-16阅览室 #Claude #技术解读

AI在测试中展现出逆向破解能力，首次记录了未被告知测试内容的情况下，通过分析问题性质和互联网资源成功解密评估系统的案例，显示传统静态基准测试面临失效的风险。...

Continue Reading

16 个 Claude 如何从零写出一个 C 编译器 | Anthropic

seed author 2026-03-14阅览室 #Claude #工程实践

通过使用16个Claude智能体团队，成功从零开始构建了一个C编译器，能够编译Linux内核，并展示了在没有人工干预的情况下，智能体如何并行合作完成复杂项目的可能性。...

Continue Reading

AI 不仅改变了产品，更重塑了销售方式

seed author 2026-03-03阅览室 #A16z #AI+商业

AI 不仅改变了产品的性质，还重塑了销售方式，使企业在销售周期、买家自主性和成交策略上发生了根本性的变化。...

Continue Reading

随机漫谈-05-AI 正在吃掉我们的语言

rosa 2026-02-25我的博客 #随机漫谈

AI 正在消解和侵蚀人类的表达形式，尤其是通过过度使用经典句式和新的“故事体”文风，导致原本优秀的表达变得令人厌恶。...

Continue Reading

为什么模仿Palantir的公司失败了

seed author 2026-02-25阅览室 #A16z #AI+商业

模仿Palantir的公司面临失败的风险，主要因为其模式难以复制，最终可能沦为高成本的咨询服务，而非具备可复用竞争优势的软件公司。...

Continue Reading

从Claude Code的数百万次交互数据中分析AI 智能体的自主性边界

seed author 2026-02-24阅览室 #Claude #技术解读

从Claude Code的用户交互数据分析发现，AI智能体的自主性正在快速增长，但有效监管需要实时监测和新的人机协作范式。...

Continue Reading

开源大语言模型的真实成本：为什么"免费"可能是最昂贵的选择

seed author 2026-02-22阅览室 #工程实践

开源大语言模型并非真正免费，其背后隐藏着巨大的运营、维护和人力成本，企业在部署这些模型时需谨慎评估其真实代价。...

Continue Reading

📄论文：单次对话才是最优解？研究证明LLM在多轮对话中性能下降 39%

seed author 2026-02-20阅览室 #技术解读 #论文

单次对话的性能显著优于多轮对话，研究显示大型语言模型在多轮对话中性能下降39%，主要由于不可靠性的急剧增加。...

Continue Reading

为何AI 植入广告是意料之中的“必然” | a16z Bryan Kim

seed author 2026-02-19阅览室 #AI+商业 #A16z

AI植入广告是互联网服务向全球广泛受众扩展的最佳路径，广告不仅支撑着互联网的发展，也为AI平台的规模化变现提供了必要的支持。...

Continue Reading

企业级 AI 军备竞赛：谁在领跑，谁是黑马，谁又是意外赢家？

seed author 2026-02-18阅览室 #AI+商业 #A16z

企业级 AI 的竞争格局正在快速演变，OpenAI 领先，Anthropic 追赶，微软在基础设施上保持主导，而第三方应用仍在蓬勃发展。...

Continue Reading

论宇宙、生命与AI

seed author 2026-02-18阅览室 #科技与人文 #Ivan Zhao

本文探讨了宇宙、生命与人工智能之间的关系，强调生命在冷漠的宇宙中努力施加其价值体系，以及人工智能在这一追求中的重要作用。...

Continue Reading

OpenAI工程负责人分享AI如何重塑编程、管理与创业 | Lenny's Podcast

seed author 2026-02-18阅览室 #OpenAI #工程实践

OpenAI工程负责人Sherwin Wu分享了AI如何重塑编程和管理方式，强调了工程师角色的转变、AI在企业流程自动化中的潜力，以及创业者应关注未来模型发展的重要性。...

Continue Reading

NEWER POSTS OLDER POSTS