Nội dung chính
1. Con số đầu tiên: 1 nghìn tỷ tham số — to cỡ nào?
Để so sánh: GPT-3 năm 2020 có 175 tỷ tham số và được xem là một bước đột phá. GPT-4 ước tính có khoảng 1,7 nghìn tỷ tham số. DeepSeek V4 tuyên bố ~1 nghìn tỷ tham số — đây là mô hình cỡ lớn thuộc hàng top thế giới.
Nhưng con số quan trọng hơn là 37 tỷ tham số hoạt động mỗi lần xử lý. DeepSeek V4 dùng kiến trúc Mixture-of-Experts (MoE) — hiểu đơn giản là mô hình có 1 nghìn tỷ "chuyên gia", nhưng mỗi câu hỏi chỉ kích hoạt một nhóm nhỏ ~37 tỷ chuyên gia phù hợp nhất. Nhờ vậy, dù to như voi nhưng chạy nhanh như mèo.
Kết quả: chi phí API chỉ 0,30 USD/triệu token — rẻ hơn khoảng 10-20 lần so với GPT-5.4 hay Claude Opus 4.6 ở cùng phân khúc hiệu suất.
2. Con số thứ hai: 5,2 triệu USD để đào tạo — ý nghĩa gì?
Dữ liệu từ NxCode ước tính DeepSeek V4 được đào tạo với chi phí khoảng 5,2 triệu USD. Để đặt vào bối cảnh: GPT-4 được ước tính tiêu tốn hơn 100 triệu USD để đào tạo.
Con số này có nghĩa là gì? DeepSeek đang chứng minh rằng không cần phải chi tiền khổng lồ mới tạo ra được AI hạng nhất thế giới. Điều đó đang làm đảo lộn logic của cuộc đua AI hiện nay — vốn được dẫn dắt bởi những công ty như OpenAI, Google, và Meta với ngân sách hàng tỷ USD.
3. Con số thứ ba: 97% độ chính xác trong ngữ cảnh 1 triệu token
DeepSeek V4 có cửa sổ ngữ cảnh 1 triệu token — tương đương khoảng 750.000 từ tiếng Anh, đủ để "nhớ" toàn bộ một cuốn sách dày khi trả lời câu hỏi.
Đặc biệt hơn, theo dữ liệu từ đội ngũ DeepSeek, mô hình đạt 97% độ chính xác trong bài kiểm tra "tìm kim trong đống cỏ" ở ngữ cảnh 1 triệu token — tức là khi bạn hỏi về một thông tin ẩn ở đâu đó trong tài liệu rất dài, mô hình vẫn tìm ra đúng 97% lần. Đây là cải tiến đáng kể so với phiên bản trước (chỉ đạt 45% ở ngữ cảnh 128K token).
Tuy nhiên cần lưu ý: các con số benchmark này đến từ đội ngũ DeepSeek nội bộ, chưa được bên thứ ba độc lập xác nhận. Nên xem đây là tuyên bố cần kiểm chứng, không phải sự thật đã xác minh.
4. Chạy trên chip Huawei — tại sao điều này quan trọng?
Reuters ngày 4/4 xác nhận DeepSeek V4 được đào tạo trên chip Huawei Ascend 950PR — không phải chip NVIDIA.
Đây là điểm đáng chú ý về địa chính trị: Mỹ đang siết xuất khẩu chip AI tiên tiến sang Trung Quốc (và nhiều nước khác trong khu vực, bao gồm một số hạn chế với Việt Nam). DeepSeek đang chứng minh rằng có thể đạt hiệu suất hàng đầu thế giới mà không cần chip NVIDIA H100/H200. Đây là cú đấm thẳng vào chiến lược kiểm soát chuỗi cung ứng chip của Mỹ.
5. Mã nguồn mở theo Apache 2.0 — bạn có thể làm gì?
Giấy phép Apache 2.0 là một trong những giấy phép mở nhất trong thế giới phần mềm. Điều đó có nghĩa là:
- Tải về và dùng miễn phí — không cần trả phí cho DeepSeek
- Chỉnh sửa và tùy biến — doanh nghiệp Việt Nam có thể fine-tune mô hình cho dữ liệu riêng (tiếng Việt, ngành kế toán, pháp lý...)
- Dùng trong sản phẩm thương mại — không vi phạm bản quyền
Theo API đang thử nghiệm (V4-Lite), tốc độ suy luận đã nhanh hơn 30% so với DeepSeek V3, với độ chính xác ngữ cảnh dài tăng đáng kể.
Điều này ảnh hưởng gì đến bạn?
Nếu bạn là cá nhân dùng AI hàng ngày: Khi DeepSeek V4 ra mắt chính thức, hãy thử dùng thông qua trang web hoặc API của họ. Với chi phí 0,30 USD/triệu token, đây là lựa chọn rẻ nhất trong phân khúc AI hiệu suất cao. Phù hợp đặc biệt với các tác vụ xử lý văn bản dài: tóm tắt hợp đồng, phân tích báo cáo, dịch thuật tài liệu.
Nếu bạn là chủ doanh nghiệp vừa và nhỏ tại Việt Nam: Mã nguồn mở Apache 2.0 có nghĩa là bạn hoặc đội ngũ kỹ thuật có thể fine-tune DeepSeek V4 với dữ liệu ngành của mình — ví dụ dữ liệu pháp lý tiếng Việt, quy trình kế toán theo chuẩn Việt Nam, hay dữ liệu khách hàng. Chi phí để làm điều này sẽ thấp hơn nhiều so với dùng Claude hay GPT-4 có tính phí theo lượt.
Nếu bạn là lập trình viên: Hãy theo dõi thông báo chính thức từ DeepSeek trong vài tuần tới. DeepSeek V4-Lite đang được thử nghiệm trên API với tốc độ inference nhanh hơn 30%. Đây là mô hình đáng để tích hợp vào sản phẩm, đặc biệt khi cần xử lý lượng lớn text với chi phí thấp.
Tại sao điều này quan trọng hơn bạn nghĩ: Nếu DeepSeek V4 thực sự đạt hiệu suất tương đương Claude Opus 4.6 với chi phí thấp hơn 10 lần và mã nguồn mở — đây là sự thay đổi căn bản trong cách AI được phân phối trên toàn thế giới. Không còn là cuộc chơi chỉ dành cho những người trả 20 USD/tháng hay những doanh nghiệp chi hàng trăm nghìn USD API.
Số liệu & thống kê
| Chỉ số | DeepSeek V4 | Ghi chú |
|---|---|---|
| Tổng tham số | ~1 nghìn tỷ | Tuyên bố nội bộ |
| Tham số hoạt động/token | ~37 tỷ | Kiến trúc MoE |
| Cửa sổ ngữ cảnh | 1 triệu token | ~750.000 từ |
| Chi phí đào tạo | ~5,2 triệu USD | Ước tính, chưa xác nhận |
| Giá API | 0,30 USD/triệu token | V4-Lite, đang thử nghiệm |
| HumanEval (coding) | 90% | Tuyên bố nội bộ, chưa xác minh độc lập |
| SWE-bench Verified | 80%+ | Tuyên bố nội bộ |
| Tốc độ inference | Nhanh hơn 30% so V3 | Báo cáo từ developer |
| Giấy phép | Apache 2.0 | Mã nguồn mở hoàn toàn |
| Chip đào tạo | Huawei Ascend 950PR | Không dùng NVIDIA |
Lưu ý: Các benchmark được đánh dấu "tuyên bố nội bộ" đến từ đội ngũ DeepSeek, chưa được bên thứ ba xác minh độc lập tính đến thời điểm bài viết.
Sources
| # | Title | URL | Ghi chú |
|---|---|---|---|
| 1 | DeepSeek V4 Full Specs & Benchmarks | https://www.nxcode.io/resources/news/deepseek-v4-release-specs-benchmarks-2026 | Nguồn EN, thông số kỹ thuật |
| 2 | DeepSeek V4: Release Date, Specs, and the Huawei Chip Bombshell | https://findskill.ai/blog/deepseek-v4-release-date-specs/ | Nguồn EN, chip Huawei |
| 3 | DeepSeek V4: Everything You Need to Know | https://www.coinlive.com/news/deepseek-v4-everything-you-need-to-know-about-the-new | Nguồn EN, tổng hợp |
| 4 | DeepSeek V4 Review | https://cybernews.com/ai-tools/deepseek-v4/ | Nguồn EN, đánh giá độc lập |
| 5 | DeepSeek V4 Release Window Prep | https://evolink.ai/blog/deepseek-v4-release-window-prep | Nguồn EN, timeline |