Agent
- Continually improving our agent harness Cursor:非常好的 Agent harness 工程复盘,讲评测、真实使用指标、故障修复,以及不同模型的 harness 适配。
- Lessons from building Claude Code: Prompt caching is everything Anthropic / Claude Code:把 prompt caching 讲成 Agent 产品设计约束:上下文组织、工具定义、模型切换和压缩策略都会影响命中率。
- How We Cut LLM Costs by 59% With Prompt Caching ProjectDiscovery / Parth Malhotra:很实在的 Prompt Caching 降本复盘:省成本不是简单打开缓存,而是要把稳定前缀、动态上下文和对话窗口组织好。
- Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。
AI
- Continually improving our agent harness Cursor:非常好的 Agent harness 工程复盘,讲评测、真实使用指标、故障修复,以及不同模型的 harness 适配。
- Lessons from building Claude Code: Prompt caching is everything Anthropic / Claude Code:把 prompt caching 讲成 Agent 产品设计约束:上下文组织、工具定义、模型切换和压缩策略都会影响命中率。
- How We Cut LLM Costs by 59% With Prompt Caching ProjectDiscovery / Parth Malhotra:很实在的 Prompt Caching 降本复盘:省成本不是简单打开缓存,而是要把稳定前缀、动态上下文和对话窗口组织好。
- Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。
Benchmark
- Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。
Claude Code
- Lessons from building Claude Code: Prompt caching is everything Anthropic / Claude Code:把 prompt caching 讲成 Agent 产品设计约束:上下文组织、工具定义、模型切换和压缩策略都会影响命中率。
Code Review
- Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。
Context Engineering
- How We Cut LLM Costs by 59% With Prompt Caching ProjectDiscovery / Parth Malhotra:很实在的 Prompt Caching 降本复盘:省成本不是简单打开缓存,而是要把稳定前缀、动态上下文和对话窗口组织好。
Engineering
- Continually improving our agent harness Cursor:非常好的 Agent harness 工程复盘,讲评测、真实使用指标、故障修复,以及不同模型的 harness 适配。
Harness
- Continually improving our agent harness Cursor:非常好的 Agent harness 工程复盘,讲评测、真实使用指标、故障修复,以及不同模型的 harness 适配。
LLM Evaluation
- Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。
LLM Infra
- How We Cut LLM Costs by 59% With Prompt Caching ProjectDiscovery / Parth Malhotra:很实在的 Prompt Caching 降本复盘:省成本不是简单打开缓存,而是要把稳定前缀、动态上下文和对话窗口组织好。
Prompt Caching
- Lessons from building Claude Code: Prompt caching is everything Anthropic / Claude Code:把 prompt caching 讲成 Agent 产品设计约束:上下文组织、工具定义、模型切换和压缩策略都会影响命中率。
- How We Cut LLM Costs by 59% With Prompt Caching ProjectDiscovery / Parth Malhotra:很实在的 Prompt Caching 降本复盘:省成本不是简单打开缓存,而是要把稳定前缀、动态上下文和对话窗口组织好。