好文记录

编号	标题	阅读时间	来源/作者	一句评价	标签
1	Continually improving our agent harness	2026-05-05	Cursor	非常好的 Agent harness 工程复盘，讲评测、真实使用指标、故障修复，以及不同模型的 harness 适配。	AIAgentHarnessEngineering
2	Lessons from building Claude Code: Prompt caching is everything	2026-05-05	Anthropic / Claude Code	把 prompt caching 讲成 Agent 产品设计约束：上下文组织、工具定义、模型切换和压缩策略都会影响命中率。	AIAgentPrompt CachingClaude Code
3	How We Cut LLM Costs by 59% With Prompt Caching	2026-05-05	ProjectDiscovery / Parth Malhotra	很实在的 Prompt Caching 降本复盘：省成本不是简单打开缓存，而是要把稳定前缀、动态上下文和对话窗口组织好。	AIAgentPrompt CachingContext EngineeringLLM Infra
4	Which Model Reviews Code Best?	2026-05-05	Factory Research / Nizar Alrifai	很喜欢这种评测方式：把 Code Review 的质量、成本和性价比数字化呈现，方便比较不同模型在真实工程任务里的取舍。	AIAgentCode ReviewBenchmarkLLM Evaluation