Nội dung chính
1. Tại sao tất cả đều muốn thoát khỏi NVIDIA?
Nhìn rộng hơn: NVIDIA đang ở vị trí mà Intel từng ở vào thập niên 90 với PC — gần như độc quyền một lớp hạ tầng cốt lõi mà cả ngành phụ thuộc vào. Chip H100/H200/B300 của NVIDIA là "xẻng" trong cơn sốt vàng AI, và NVIDIA đang bán được với giá rất cao.
Vấn đề là: chi phí chip NVIDIA đang chiếm tỷ lệ khổng lồ trong ngân sách vận hành AI của tất cả các công ty. Mỗi lần bạn gọi một API AI, đâu đó trên thế giới có một con chip NVIDIA đang chạy để xử lý yêu cầu đó — và công ty AI đang trả tiền cho điều đó. Khi quy mô tăng lên hàng tỷ lượt mỗi ngày, số tiền đó trở nên rất lớn.
Câu trả lời của tất cả Big Tech: tự làm chip riêng.
2. Năm đối thủ đang thách thức NVIDIA
Meta — MTIA 300/400/450/500
Meta vừa công bố kế hoạch phát triển 4 thế hệ chip MTIA liên tiếp, tất cả sản xuất tại TSMC và đồng phát triển với Broadcom. Điểm đặc biệt: Meta chọn kiến trúc RISC-V thay vì Arm — để tránh phụ thuộc vào bản quyền thêm một lớp nữa. Theo Tom's Hardware, dòng MTIA đạt mức tăng 25 lần hiệu suất tính toán qua các thế hệ.
Mục tiêu của Meta không phải thay NVIDIA hoàn toàn — mà là tự chủ phần inference (chạy AI sau khi đã huấn luyện), đây là nơi tốn tiền nhất trong vận hành hàng ngày.
Google — Trillium (TPU v6e)
Google là đơn vị có kinh nghiệm lâu nhất trong cuộc đua này — đã tự làm chip TPU từ năm 2015. Thế hệ mới nhất Trillium đạt 4,7 lần hiệu suất so với TPU v5e, với hơn 100.000 chip đang vận hành trong thực tế ở mức hiệu suất 99% khi chạy cluster 3.072 chip. Đây là bằng chứng trưởng thành nhất trong nhóm.
Amazon — Trainium3
Amazon Trainium3 đạt 2,52 PFLOPs tính toán FP8 với bộ nhớ 144GB HBM3e trên tiến trình 3nm. Quan trọng hơn là tín hiệu: Anthropic (Claude) và OpenAI (ChatGPT) đã dùng Trainium3 cho cả huấn luyện lẫn inference — đây là bước khẳng định mạnh mẽ rằng chip của Amazon đã đủ tốt cho các mô hình AI hàng đầu thế giới.
Microsoft — Maia 200
Microsoft Maia 200 với 140 tỷ transistor và 216GB HBM3e, được triển khai tại các data center Azure. Microsoft định vị Maia đặc biệt cho inference, với tuyên bố 3 lần hiệu suất FP4 so với Amazon Trainium3. Hiện đang phục vụ các workload của Azure AI và Microsoft 365 Copilot.
Trung Quốc — Huawei Ascend + DeepSeek
Đây là phần bức tranh thường bị bỏ qua. Reuters xác nhận DeepSeek V4 sẽ chạy trên chip Huawei Ascend 950PR. Alibaba, ByteDance và Tencent đã đặt hàng hàng trăm nghìn chip Huawei. Và GLM-5 — mô hình frontier của Zhipu AI — là mô hình đầu tiên được huấn luyện hoàn toàn mà không dùng chip NVIDIA.
Điều này có nghĩa là Trung Quốc đã vượt qua được rào cản cấm vận chip của Mỹ ở một mức độ đáng kể.
3. Bảng so sánh nhanh
| Chip | Công ty | Mục tiêu chính | Điểm nổi bật |
|---|---|---|---|
| MTIA 300–500 | Meta | Inference quy mô lớn | RISC-V, +25x qua các thế hệ |
| Trillium (TPU v6e) | Cả training & inference | Trưởng thành nhất, 100K+ chips đang chạy | |
| Trainium3 | Amazon | Training AI lớn | OpenAI & Anthropic đang dùng |
| Maia 200 | Microsoft | Inference Azure | 3x FP4 so với Trainium3 |
| Ascend 950PR | Huawei | Toàn bộ AI stack | DeepSeek V4 chạy trên đây |
| B300 Blackwell | NVIDIA | Training + inference | Vẫn mạnh nhất tuyệt đối, nhưng đắt |
4. NVIDIA đang ở đâu trong bức tranh này?
Thẳng thắn mà nói: NVIDIA chưa thua, nhưng thế độc quyền đang bị thu hẹp.
NVIDIA B300 Blackwell Ultra với 288GB HBM3e và 15 PFLOPs dense FP4 vẫn là chip mạnh nhất tuyệt đối hiện nay. Hơn nữa, NVIDIA có vũ khí mà không ai có thể copy nhanh được: CUDA — hệ sinh thái phần mềm mà hầu hết AI framework, thư viện, và công cụ đều được tối ưu cho.
Lợi thế của NVIDIA sẽ còn bền vững nhất ở pre-training (huấn luyện mô hình từ đầu) — công đoạn tốn kém nhất, cần nhiều chip nhất, và đòi hỏi phần mềm tối ưu nhất. Tất cả frontier model mới hiện vẫn được huấn luyện chủ yếu trên NVIDIA.
Nhưng ở inference (chạy AI phục vụ người dùng mỗi ngày) — đây là nơi các chip tùy chỉnh đang chiếm dần thị phần, và đây cũng là nơi tốn tiền nhất trong vận hành dài hạn.
Điều này ảnh hưởng gì đến bạn?
Với người dùng AI thông thường: Cuộc đua chip này trực tiếp ảnh hưởng đến giá và tốc độ của các dịch vụ AI bạn đang dùng. Khi chi phí chip giảm hoặc cạnh tranh tăng, giá API AI xu hướng sẽ giảm theo — và điều đó có nghĩa là trong 2-3 năm tới, các công cụ AI mạnh hơn sẽ ngày càng rẻ hơn để tiếp cận.
Với doanh nghiệp Việt Nam: Hiện tại không cần làm gì ngay, nhưng cần theo dõi. Khi chi phí inference giảm đủ thấp — và nó đang giảm rõ rệt — các giải pháp AI on-premise (chạy AI trên máy chủ riêng của doanh nghiệp) sẽ ngày càng khả thi hơn với ngân sách vừa và nhỏ.
Với Việt Nam ở góc độ vĩ mô: Việt Nam không có khả năng tham gia cuộc đua sản xuất chip AI trong ngắn và trung hạn — đây là cuộc chơi cần hàng chục tỷ USD đầu tư nhà máy sản xuất. Nhưng Việt Nam có thể tận dụng: khi hạ tầng AI toàn cầu ngày càng rẻ hơn và đa dạng hơn (đặc biệt từ Trung Quốc qua các chip Huawei mã nguồn mở), cơ hội để doanh nghiệp VN tự xây dựng giải pháp AI riêng sẽ rộng mở hơn nhiều.
Điều quan trọng nhất: Đây không phải câu hỏi về công nghệ — đây là câu hỏi về ai sẽ kiểm soát nền tảng tính toán của thập kỷ tới. Indonesia đang xây data center, Thái Lan đang đàm phán với NVIDIA về trung tâm AI quốc gia. Việt Nam cần có một chiến lược rõ ràng hơn về hạ tầng AI quốc gia trước khi cuộc đua này kết thúc và bản đồ quyền lực được vẽ lại.
Số liệu & thống kê
| Chỉ số | Con số | Nguồn |
|---|---|---|
| Meta MTIA: mức tăng hiệu suất | 25x qua các thế hệ | Tom's Hardware |
| Google Trillium: chip đang vận hành | 100.000+ chips | Nerd Level Tech |
| Google Trillium: hiệu quả cluster | 99% ở 3.072 chips | Nerd Level Tech |
| Amazon Trainium3: tính toán | 2,52 PFLOPs FP8 | Nerd Level Tech |
| Microsoft Maia: lợi thế FP4 | 3x so với Trainium3 | Nerd Level Tech |
| NVIDIA B300: hiệu suất | 15 PFLOPs dense FP4 | Nerd Level Tech |
| Huawei chip: đơn hàng lớn | Hàng trăm nghìn chip | Reuters |
Sources
| # | Title | URL | Ghi chú |
|---|---|---|---|
| 1 | The Custom AI Chip Race 2026 | https://nerdleveltech.com/the-custom-ai-chip-race-2026-meta-google-amazon-microsoft-vs-nvidia | Nguồn EN, phân tích tổng quan |
| 2 | Meta's MTIA lineup | https://www.tomshardware.com/tech-industry/semiconductors/metas-mtia-chip-lineup-joins-hyperscaler-push-to-replace-nvidia-at-inference | Nguồn EN, Tom's Hardware |
| 3 | DeepSeek Huawei chip | https://techwireasia.com/2026/04/deepseek-v4-points-to-growing-use-of-huawei-chips-in-ai-models/ | Nguồn EN, TechWire Asia |
| 4 | GLM-5 on Huawei Ascend | https://lushbinary.com/blog/glm-5-developer-guide-zhipu-ai-huawei-ascend-open-weight/ | Nguồn EN, chi tiết kỹ thuật |
| 5 | DeepSeek Huawei specs | https://findskill.ai/blog/deepseek-v4-release-date-specs/ | Nguồn EN, thông số |