18 bài viết được gắn thẻ "Tiếng Việt"

Nội dung và benchmark liên quan đến xử lý ngôn ngữ tiếng Việt với các mô hình AI.

RAG Không Chỉ Là Vector: Hai Trụ Cột Retrieval và Generation

1 tháng 7, 2026 · 4 phút để đọc

Just another developer!

Khi nghe "RAG", đa số developer nghĩ ngay: embed document thành vector, lưu vào vector DB, query top-k, dúi vào LLM. Đúng một phần — nhưng cách nghĩ đó làm mất đi bức tranh thật.

RAG viết tắt của Retrieval-Augmented Generation. Tên đã nói lên hai trụ cột: một bên đi tìm thông tin (Retrieval), một bên dùng thông tin đó để sinh câu trả lời (Generation). Mục tiêu cuối cùng không phải là "có vector DB", mà là trả lời đúng, đủ và thông minh cho câu hỏi của người dùng.

Nex-N2-Pro: Model Agentic Mới Với Benchmark Rất Cao

9 tháng 6, 2026 · 5 phút để đọc

ManhPT

Just another developer!

Nex AGI vừa công bố Nex-N2-Pro, một model agentic open-source mới nhắm thẳng vào nhóm use case đang nóng nhất hiện nay: coding agent, tool use, terminal execution và các workflow dài hơi có feedback từ môi trường thật.

Điểm gây chú ý không phải chỉ là "thêm một model LLM mới", mà là bảng benchmark được công bố: Nex-N2-Pro đạt 80.8 trên SWE-Bench Verified, 75.3 trên Terminal-Bench 2.1, 58.8 trên SWE-Bench Pro, 83.7 trên BrowseComp và 90.7 trên GPQA Diamond. Nếu các con số này được kiểm chứng độc lập, đây là một trong những model open-source đáng theo dõi nhất cho agentic coding trong năm nay.

Benchmark overview của Nex-N2-Pro

Headroom, RTK, Caveman: Các Công Cụ Tiết Kiệm Token Cho Coding Agent

6 tháng 6, 2026 · 18 phút để đọc

ManhPT

Just another developer!

Coding agent đang bước vào giai đoạn mà chi phí không chỉ nằm ở model nào rẻ hơn, mà ở việc agent nhìn thấy bao nhiêu thứ không cần thiết. Một lần pytest dài, một git diff quá rộng, một log Kubernetes ồn ào, một file CLAUDE.md phình dần qua nhiều tháng — tất cả đều biến thành input tokens, rồi tiếp tục bị kéo theo ở các vòng sau.

Vì vậy, vài tháng gần đây xuất hiện một lớp công cụ mới: không thay model, không thay IDE, mà đứng giữa agent và context để cắt bớt token. Bài này tập trung vào đúng nhóm đó: Headroom, RTK, LeanCTX và Caveman.

Tóm tắt giải pháp: nếu agent tốn token vì test/log/git output, bắt đầu với RTK. Nếu agent đọc file quá rộng trong repo lớn, thử LeanCTX hoặc jCodeMunch. Nếu workflow có nhiều RAG/API/log/multi-agent context, nghiên cứu Headroom. Nếu agent dài dòng, dùng Caveman. Và luôn nhớ: với security audit, repo không tin cậy, hoặc lỗi khó debug, hãy quay về raw output.

Domain-Aware RAG: Khi Retrieval-Augmented Generation Rời Phòng Lab Bước Vào Thực Tiễn

30 tháng 5, 2026 · 18 phút để đọc

ManhPT

Just another developer!

RAG (Retrieval-Augmented Generation) đã đi được một chặng đường dài từ những ngày đầu "nhét context vào prompt". Năm 2025-2026 chứng kiến sự bùng nổ của các hệ thống RAG chuyên biệt hóa theo từng domain — nơi retrieval không còn là bài toán "tìm document giống nhất", mà là bài toán "tìm thông tin hữu ích nhất cho một ngữ cảnh chuyên môn cụ thể".

Bài viết này khảo sát 22 paper mới nhất về domain-aware RAG trên 8 lĩnh vực, rút ra những insight chung và bài học thực tiễn cho ai đang xây dựng hệ thống RAG trong doanh nghiệp.

AI Ngày Càng Đắt Đỏ: Khi Token Ăn Hết Ngân Sách Mà ROI Vẫn Là Dấu Hỏi

28 tháng 5, 2026 · 15 phút để đọc

ManhPT

Just another developer!

Cuối tháng 5/2026, một con số gây chấn động làng công nghệ bị rò rỉ: Anthropic đang trả 1,25 tỷ USD mỗi tháng cho SpaceX — chỉ riêng tiền compute. Nhưng câu chuyện lớn hơn không nằm ở Anthropic. Nó nằm ở hàng nghìn doanh nghiệp đang lặng lẽ đốt ngân sách vào AI token mỗi tháng — mà không ai dám chắc khoản đầu tư ấy có thực sự sinh lời.

Bài viết này không bàn về cuộc đua của các ông lớn. Nó bàn về bạn: một doanh nghiệp đang trả tiền token hàng tháng, và câu hỏi khó chịu nhất — liệu số tiền đó có đáng không?

Architecting Trong Kỷ Nguyên AI: Vì Sao Vai Trò Kiến Trúc Sư Chưa Bao Giờ Quan Trọng Hơn

23 tháng 5, 2026 · 5 phút để đọc

ManhPT

Just another developer!

Có một câu hỏi tôi gặp ngày càng nhiều trong các cuộc trò chuyện với đồng nghiệp: "AI code giỏi thế rồi, kiến trúc sư phần mềm còn cần không?"

Câu trả lời ngắn: Cần. Hơn bao giờ hết.

Nhưng câu trả lời dài thì thú vị hơn nhiều.

Antigravity + Skill Bundle: Hiệu suất gấp 10 lần, chi phí bằng 0

20 tháng 5, 2026 · 6 phút để đọc

ManhPT

Just another developer!

Antigravity 2.0 có gói miễn phí. Antigravity Awesome Skills có hơn 1.400 Agent Skill được cộng đồng gần 40.000 sao đóng góp. Gộp hai thứ này lại, bạn có một đội ngũ chuyên gia AI đa lĩnh vực — chi phí 0 đồng.

Không phải nói quá đâu. Đây là cách tận dụng hạ tầng có sẵn để làm việc thông minh hơn.

Google Antigravity 2.0: Từ IDE đơn lẻ thành nền tảng agent-first toàn diện

20 tháng 5, 2026 · 11 phút để đọc

ManhPT

Just another developer!

Google vừa có một cú "lột xác" đáng gờm với Antigravity. Nếu phiên bản 1.0 ra mắt tháng 11/2025 chỉ là một IDE hỗ trợ viết mã bằng AI, thì Antigravity 2.0 là cả một hệ sinh thái phát triển xoay quanh điều phối đa tác nhân (multi-agent orchestration). Đây không còn là một công cụ — mà là một nền tảng.

Điều đáng chú ý: Google đã dùng chính Antigravity để đồng phát triển Gemini 3.5 Flash — mô hình mặc định của nền tảng này. "Ăn cơm nhà nấu" ở cấp độ cao nhất.

AI Trung Quốc miễn phí 100%: Chiến lược "vũ khí hóa" sự hào phóng?

2 tháng 5, 2026 · 9 phút để đọc

ManhPT

Just another developer!

Khi ChatGPT Plus lên $200/tháng, DeepSeek và Qwen vẫn không có nút trả tiền. Mở kho ứng dụng, bạn thấy ChatGPT với nút Nâng cấp lên Plus ngay màn hình chính. Claude tương tự: $20/tháng cho gói Pro. Google Gemini Advanced: $19.99/tháng.

Còn DeepSeek và Qwen? Không có nút nào hết. Không thuê bao, không tường phí, không gói cao cấp. Mọi tính năng đều miễn phí, kể cả model mới nhất.

Câu hỏi hiển nhiên: tiền đâu mà họ tồn tại? Và quan trọng hơn: đây có phải là một nước cờ địa chính trị được tính toán kỹ lưỡng?

Cảm Giác Dùng DeepSeek V4 Với OpenClaw: Rẻ Đến Mức Thấy… Có Lỗi

29 tháng 4, 2026 · 9 phút để đọc

ManhPT

Just another developer!

Tóm tắt — Tôi đã chuyển OpenClaw sang dùng DeepSeek V4 được vài ngày. Cảm giác đầu tiên: "hình như billing bị lỗi". Kiểm tra kỹ thì hóa ra không — DeepSeek thực sự rẻ đến mức đó. Bài viết này chia sẻ trải nghiệm thực tế, phân tích bảng giá chính thức (cập nhật 29/4/2026), cơ chế disk cache tự động giúp giảm thêm 80-90% chi phí input, và so sánh cụ thể với GPT-5.5 lẫn Claude Opus.