DeepSeek V4: AI 1 nghìn tỷ tham số sắp ra mắt, mã nguồn mở Apache 2.0

Nội dung chính

1. Con số đầu tiên: 1 nghìn tỷ tham số — to cỡ nào?

Để so sánh: GPT-3 năm 2020 có 175 tỷ tham số và được xem là một bước đột phá. GPT-4 ước tính có khoảng 1,7 nghìn tỷ tham số. DeepSeek V4 tuyên bố ~1 nghìn tỷ tham số — đây là mô hình cỡ lớn thuộc hàng top thế giới.

Nhưng con số quan trọng hơn là 37 tỷ tham số hoạt động mỗi lần xử lý. DeepSeek V4 dùng kiến trúc Mixture-of-Experts (MoE) — hiểu đơn giản là mô hình có 1 nghìn tỷ "chuyên gia", nhưng mỗi câu hỏi chỉ kích hoạt một nhóm nhỏ ~37 tỷ chuyên gia phù hợp nhất. Nhờ vậy, dù to như voi nhưng chạy nhanh như mèo.

Kết quả: chi phí API chỉ 0,30 USD/triệu token — rẻ hơn khoảng 10-20 lần so với GPT-5.4 hay Claude Opus 4.6 ở cùng phân khúc hiệu suất.

2. Con số thứ hai: 5,2 triệu USD để đào tạo — ý nghĩa gì?

Dữ liệu từ NxCode ước tính DeepSeek V4 được đào tạo với chi phí khoảng 5,2 triệu USD. Để đặt vào bối cảnh: GPT-4 được ước tính tiêu tốn hơn 100 triệu USD để đào tạo.

Con số này có nghĩa là gì? DeepSeek đang chứng minh rằng không cần phải chi tiền khổng lồ mới tạo ra được AI hạng nhất thế giới. Điều đó đang làm đảo lộn logic của cuộc đua AI hiện nay — vốn được dẫn dắt bởi những công ty như OpenAI, Google, và Meta với ngân sách hàng tỷ USD.

3. Con số thứ ba: 97% độ chính xác trong ngữ cảnh 1 triệu token

DeepSeek V4 có cửa sổ ngữ cảnh 1 triệu token — tương đương khoảng 750.000 từ tiếng Anh, đủ để "nhớ" toàn bộ một cuốn sách dày khi trả lời câu hỏi.

Đặc biệt hơn, theo dữ liệu từ đội ngũ DeepSeek, mô hình đạt 97% độ chính xác trong bài kiểm tra "tìm kim trong đống cỏ" ở ngữ cảnh 1 triệu token — tức là khi bạn hỏi về một thông tin ẩn ở đâu đó trong tài liệu rất dài, mô hình vẫn tìm ra đúng 97% lần. Đây là cải tiến đáng kể so với phiên bản trước (chỉ đạt 45% ở ngữ cảnh 128K token).

Tuy nhiên cần lưu ý: các con số benchmark này đến từ đội ngũ DeepSeek nội bộ, chưa được bên thứ ba độc lập xác nhận. Nên xem đây là tuyên bố cần kiểm chứng, không phải sự thật đã xác minh.

4. Chạy trên chip Huawei — tại sao điều này quan trọng?

Reuters ngày 4/4 xác nhận DeepSeek V4 được đào tạo trên chip Huawei Ascend 950PR — không phải chip NVIDIA.

Đây là điểm đáng chú ý về địa chính trị: Mỹ đang siết xuất khẩu chip AI tiên tiến sang Trung Quốc (và nhiều nước khác trong khu vực, bao gồm một số hạn chế với Việt Nam). DeepSeek đang chứng minh rằng có thể đạt hiệu suất hàng đầu thế giới mà không cần chip NVIDIA H100/H200. Đây là cú đấm thẳng vào chiến lược kiểm soát chuỗi cung ứng chip của Mỹ.

5. Mã nguồn mở theo Apache 2.0 — bạn có thể làm gì?

Giấy phép Apache 2.0 là một trong những giấy phép mở nhất trong thế giới phần mềm. Điều đó có nghĩa là:

Tải về và dùng miễn phí — không cần trả phí cho DeepSeek
Chỉnh sửa và tùy biến — doanh nghiệp Việt Nam có thể fine-tune mô hình cho dữ liệu riêng (tiếng Việt, ngành kế toán, pháp lý...)
Dùng trong sản phẩm thương mại — không vi phạm bản quyền

Theo API đang thử nghiệm (V4-Lite), tốc độ suy luận đã nhanh hơn 30% so với DeepSeek V3, với độ chính xác ngữ cảnh dài tăng đáng kể.

Điều này ảnh hưởng gì đến bạn?

Nếu bạn là cá nhân dùng AI hàng ngày: Khi DeepSeek V4 ra mắt chính thức, hãy thử dùng thông qua trang web hoặc API của họ. Với chi phí 0,30 USD/triệu token, đây là lựa chọn rẻ nhất trong phân khúc AI hiệu suất cao. Phù hợp đặc biệt với các tác vụ xử lý văn bản dài: tóm tắt hợp đồng, phân tích báo cáo, dịch thuật tài liệu.

Nếu bạn là chủ doanh nghiệp vừa và nhỏ tại Việt Nam: Mã nguồn mở Apache 2.0 có nghĩa là bạn hoặc đội ngũ kỹ thuật có thể fine-tune DeepSeek V4 với dữ liệu ngành của mình — ví dụ dữ liệu pháp lý tiếng Việt, quy trình kế toán theo chuẩn Việt Nam, hay dữ liệu khách hàng. Chi phí để làm điều này sẽ thấp hơn nhiều so với dùng Claude hay GPT-4 có tính phí theo lượt.

Nếu bạn là lập trình viên: Hãy theo dõi thông báo chính thức từ DeepSeek trong vài tuần tới. DeepSeek V4-Lite đang được thử nghiệm trên API với tốc độ inference nhanh hơn 30%. Đây là mô hình đáng để tích hợp vào sản phẩm, đặc biệt khi cần xử lý lượng lớn text với chi phí thấp.

Tại sao điều này quan trọng hơn bạn nghĩ: Nếu DeepSeek V4 thực sự đạt hiệu suất tương đương Claude Opus 4.6 với chi phí thấp hơn 10 lần và mã nguồn mở — đây là sự thay đổi căn bản trong cách AI được phân phối trên toàn thế giới. Không còn là cuộc chơi chỉ dành cho những người trả 20 USD/tháng hay những doanh nghiệp chi hàng trăm nghìn USD API.

Số liệu & thống kê

Chỉ số	DeepSeek V4	Ghi chú
Tổng tham số	~1 nghìn tỷ	Tuyên bố nội bộ
Tham số hoạt động/token	~37 tỷ	Kiến trúc MoE
Cửa sổ ngữ cảnh	1 triệu token	~750.000 từ
Chi phí đào tạo	~5,2 triệu USD	Ước tính, chưa xác nhận
Giá API	0,30 USD/triệu token	V4-Lite, đang thử nghiệm
HumanEval (coding)	90%	Tuyên bố nội bộ, chưa xác minh độc lập
SWE-bench Verified	80%+	Tuyên bố nội bộ
Tốc độ inference	Nhanh hơn 30% so V3	Báo cáo từ developer
Giấy phép	Apache 2.0	Mã nguồn mở hoàn toàn
Chip đào tạo	Huawei Ascend 950PR	Không dùng NVIDIA

Lưu ý: Các benchmark được đánh dấu "tuyên bố nội bộ" đến từ đội ngũ DeepSeek, chưa được bên thứ ba xác minh độc lập tính đến thời điểm bài viết.

Sources

#	Title	URL	Ghi chú
1	DeepSeek V4 Full Specs & Benchmarks	https://www.nxcode.io/resources/news/deepseek-v4-release-specs-benchmarks-2026	Nguồn EN, thông số kỹ thuật
2	DeepSeek V4: Release Date, Specs, and the Huawei Chip Bombshell	https://findskill.ai/blog/deepseek-v4-release-date-specs/	Nguồn EN, chip Huawei
3	DeepSeek V4: Everything You Need to Know	https://www.coinlive.com/news/deepseek-v4-everything-you-need-to-know-about-the-new	Nguồn EN, tổng hợp
4	DeepSeek V4 Review	https://cybernews.com/ai-tools/deepseek-v4/	Nguồn EN, đánh giá độc lập
5	DeepSeek V4 Release Window Prep	https://evolink.ai/blog/deepseek-v4-release-window-prep	Nguồn EN, timeline

DeepSeek V4 sắp ra mắt: mô hình AI 1 nghìn tỷ tham số, mã nguồn mở hoàn toàn — người Việt được lợi gì?

Nội dung chính

1. Con số đầu tiên: 1 nghìn tỷ tham số — to cỡ nào?

2. Con số thứ hai: 5,2 triệu USD để đào tạo — ý nghĩa gì?

3. Con số thứ ba: 97% độ chính xác trong ngữ cảnh 1 triệu token

4. Chạy trên chip Huawei — tại sao điều này quan trọng?

5. Mã nguồn mở theo Apache 2.0 — bạn có thể làm gì?

Điều này ảnh hưởng gì đến bạn?

Số liệu & thống kê

Sources

Bài viết liên quan

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Studio game nào đang dùng AI hiệu quả, studio nào đang thất bại? Toàn cảnh 2026

OpenAI vs. Anthropic vs. Google: ai đang giải quyết vấn đề model collapse tốt nhất?