好文标签

按标签查看好文记录。

Agent

AI

Benchmark

  • Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。

Claude Code

Code Review

  • Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。

Context Engineering

Engineering

Harness

LLM Evaluation

  • Which Model Reviews Code Best? Factory Research / Nizar Alrifai:很喜欢这种评测方式:把 Code Review 的质量、成本和性价比数字化呈现,方便比较不同模型在真实工程任务里的取舍。

LLM Infra

Prompt Caching

记录工程实践、问题复盘和技术判断。
使用 Hugo 构建
主题 StackJimmy 设计