| 编号 | 标题 | 阅读时间 | 来源/作者 | 一句评价 | 标签 |
|---|---|---|---|---|---|
| 1 | Continually improving our agent harness | 2026-05-05 | Cursor | 非常好的 Agent harness 工程复盘,讲评测、真实使用指标、故障修复,以及不同模型的 harness 适配。 | |
| 2 | Lessons from building Claude Code: Prompt caching is everything | 2026-05-05 | Anthropic / Claude Code | 把 prompt caching 讲成 Agent 产品设计约束:上下文组织、工具定义、模型切换和压缩策略都会影响命中率。 | |
| 3 | How We Cut LLM Costs by 59% With Prompt Caching | 2026-05-05 | ProjectDiscovery / Parth Malhotra | 很实在的 Prompt Caching 降本复盘:省成本不是简单打开缓存,而是要把稳定前缀、动态上下文和对话窗口组织好。 | |
| 4 | Which Model Reviews Code Best? | 2026-05-05 | Factory Research / Nizar Alrifai | 很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。 |