Headroom, RTK, Caveman: Các Công Cụ Tiết Kiệm Token Cho Coding Agent
Coding agent đang bước vào giai đoạn mà chi phí không chỉ nằm ở model nào rẻ hơn, mà ở việc agent nhìn thấy bao nhiêu thứ không cần thiết. Một lần pytest dài, một git diff quá rộng, một log Kubernetes ồn ào, một file CLAUDE.md phình dần qua nhiều tháng — tất cả đều biến thành input tokens, rồi tiếp tục bị kéo theo ở các vòng sau.
Vì vậy, vài tháng gần đây xuất hiện một lớp công cụ mới: không thay model, không thay IDE, mà đứng giữa agent và context để cắt bớt token. Bài này tập trung vào đúng nhóm đó: Headroom, RTK, LeanCTX và Caveman.
Tóm tắt giải pháp: nếu agent tốn token vì test/log/git output, bắt đầu với RTK. Nếu agent đọc file quá rộng trong repo lớn, thử LeanCTX hoặc jCodeMunch. Nếu workflow có nhiều RAG/API/log/multi-agent context, nghiên cứu Headroom. Nếu agent dài dòng, dùng Caveman. Và luôn nhớ: với security audit, repo không tin cậy, hoặc lỗi khó debug, hãy quay về raw output.