Cuộc đua chip AI 2026: Meta, Google, Amazon tự làm chip — NVIDIA đang bị thách thức

Nội dung chính

1. Tại sao tất cả đều muốn thoát khỏi NVIDIA?

Nhìn rộng hơn: NVIDIA đang ở vị trí mà Intel từng ở vào thập niên 90 với PC — gần như độc quyền một lớp hạ tầng cốt lõi mà cả ngành phụ thuộc vào. Chip H100/H200/B300 của NVIDIA là "xẻng" trong cơn sốt vàng AI, và NVIDIA đang bán được với giá rất cao.

Vấn đề là: chi phí chip NVIDIA đang chiếm tỷ lệ khổng lồ trong ngân sách vận hành AI của tất cả các công ty. Mỗi lần bạn gọi một API AI, đâu đó trên thế giới có một con chip NVIDIA đang chạy để xử lý yêu cầu đó — và công ty AI đang trả tiền cho điều đó. Khi quy mô tăng lên hàng tỷ lượt mỗi ngày, số tiền đó trở nên rất lớn.

Câu trả lời của tất cả Big Tech: tự làm chip riêng.

2. Năm đối thủ đang thách thức NVIDIA

Meta — MTIA 300/400/450/500

Meta vừa công bố kế hoạch phát triển 4 thế hệ chip MTIA liên tiếp, tất cả sản xuất tại TSMC và đồng phát triển với Broadcom. Điểm đặc biệt: Meta chọn kiến trúc RISC-V thay vì Arm — để tránh phụ thuộc vào bản quyền thêm một lớp nữa. Theo Tom's Hardware, dòng MTIA đạt mức tăng 25 lần hiệu suất tính toán qua các thế hệ.

Mục tiêu của Meta không phải thay NVIDIA hoàn toàn — mà là tự chủ phần inference (chạy AI sau khi đã huấn luyện), đây là nơi tốn tiền nhất trong vận hành hàng ngày.

Google — Trillium (TPU v6e)

Google là đơn vị có kinh nghiệm lâu nhất trong cuộc đua này — đã tự làm chip TPU từ năm 2015. Thế hệ mới nhất Trillium đạt 4,7 lần hiệu suất so với TPU v5e, với hơn 100.000 chip đang vận hành trong thực tế ở mức hiệu suất 99% khi chạy cluster 3.072 chip. Đây là bằng chứng trưởng thành nhất trong nhóm.

Amazon — Trainium3

Amazon Trainium3 đạt 2,52 PFLOPs tính toán FP8 với bộ nhớ 144GB HBM3e trên tiến trình 3nm. Quan trọng hơn là tín hiệu: Anthropic (Claude) và OpenAI (ChatGPT) đã dùng Trainium3 cho cả huấn luyện lẫn inference — đây là bước khẳng định mạnh mẽ rằng chip của Amazon đã đủ tốt cho các mô hình AI hàng đầu thế giới.

Microsoft — Maia 200

Microsoft Maia 200 với 140 tỷ transistor và 216GB HBM3e, được triển khai tại các data center Azure. Microsoft định vị Maia đặc biệt cho inference, với tuyên bố 3 lần hiệu suất FP4 so với Amazon Trainium3. Hiện đang phục vụ các workload của Azure AI và Microsoft 365 Copilot.

Trung Quốc — Huawei Ascend + DeepSeek

Đây là phần bức tranh thường bị bỏ qua. Reuters xác nhận DeepSeek V4 sẽ chạy trên chip Huawei Ascend 950PR. Alibaba, ByteDance và Tencent đã đặt hàng hàng trăm nghìn chip Huawei. Và GLM-5 — mô hình frontier của Zhipu AI — là mô hình đầu tiên được huấn luyện hoàn toàn mà không dùng chip NVIDIA.

Điều này có nghĩa là Trung Quốc đã vượt qua được rào cản cấm vận chip của Mỹ ở một mức độ đáng kể.

3. Bảng so sánh nhanh

Chip	Công ty	Mục tiêu chính	Điểm nổi bật
MTIA 300–500	Meta	Inference quy mô lớn	RISC-V, +25x qua các thế hệ
Trillium (TPU v6e)	Google	Cả training & inference	Trưởng thành nhất, 100K+ chips đang chạy
Trainium3	Amazon	Training AI lớn	OpenAI & Anthropic đang dùng
Maia 200	Microsoft	Inference Azure	3x FP4 so với Trainium3
Ascend 950PR	Huawei	Toàn bộ AI stack	DeepSeek V4 chạy trên đây
B300 Blackwell	NVIDIA	Training + inference	Vẫn mạnh nhất tuyệt đối, nhưng đắt

4. NVIDIA đang ở đâu trong bức tranh này?

Thẳng thắn mà nói: NVIDIA chưa thua, nhưng thế độc quyền đang bị thu hẹp.

NVIDIA B300 Blackwell Ultra với 288GB HBM3e và 15 PFLOPs dense FP4 vẫn là chip mạnh nhất tuyệt đối hiện nay. Hơn nữa, NVIDIA có vũ khí mà không ai có thể copy nhanh được: CUDA — hệ sinh thái phần mềm mà hầu hết AI framework, thư viện, và công cụ đều được tối ưu cho.

Lợi thế của NVIDIA sẽ còn bền vững nhất ở pre-training (huấn luyện mô hình từ đầu) — công đoạn tốn kém nhất, cần nhiều chip nhất, và đòi hỏi phần mềm tối ưu nhất. Tất cả frontier model mới hiện vẫn được huấn luyện chủ yếu trên NVIDIA.

Nhưng ở inference (chạy AI phục vụ người dùng mỗi ngày) — đây là nơi các chip tùy chỉnh đang chiếm dần thị phần, và đây cũng là nơi tốn tiền nhất trong vận hành dài hạn.

Điều này ảnh hưởng gì đến bạn?

Với người dùng AI thông thường: Cuộc đua chip này trực tiếp ảnh hưởng đến giá và tốc độ của các dịch vụ AI bạn đang dùng. Khi chi phí chip giảm hoặc cạnh tranh tăng, giá API AI xu hướng sẽ giảm theo — và điều đó có nghĩa là trong 2-3 năm tới, các công cụ AI mạnh hơn sẽ ngày càng rẻ hơn để tiếp cận.

Với doanh nghiệp Việt Nam: Hiện tại không cần làm gì ngay, nhưng cần theo dõi. Khi chi phí inference giảm đủ thấp — và nó đang giảm rõ rệt — các giải pháp AI on-premise (chạy AI trên máy chủ riêng của doanh nghiệp) sẽ ngày càng khả thi hơn với ngân sách vừa và nhỏ.

Với Việt Nam ở góc độ vĩ mô: Việt Nam không có khả năng tham gia cuộc đua sản xuất chip AI trong ngắn và trung hạn — đây là cuộc chơi cần hàng chục tỷ USD đầu tư nhà máy sản xuất. Nhưng Việt Nam có thể tận dụng: khi hạ tầng AI toàn cầu ngày càng rẻ hơn và đa dạng hơn (đặc biệt từ Trung Quốc qua các chip Huawei mã nguồn mở), cơ hội để doanh nghiệp VN tự xây dựng giải pháp AI riêng sẽ rộng mở hơn nhiều.

Điều quan trọng nhất: Đây không phải câu hỏi về công nghệ — đây là câu hỏi về ai sẽ kiểm soát nền tảng tính toán của thập kỷ tới. Indonesia đang xây data center, Thái Lan đang đàm phán với NVIDIA về trung tâm AI quốc gia. Việt Nam cần có một chiến lược rõ ràng hơn về hạ tầng AI quốc gia trước khi cuộc đua này kết thúc và bản đồ quyền lực được vẽ lại.

Số liệu & thống kê

Chỉ số	Con số	Nguồn
Meta MTIA: mức tăng hiệu suất	25x qua các thế hệ	Tom's Hardware
Google Trillium: chip đang vận hành	100.000+ chips	Nerd Level Tech
Google Trillium: hiệu quả cluster	99% ở 3.072 chips	Nerd Level Tech
Amazon Trainium3: tính toán	2,52 PFLOPs FP8	Nerd Level Tech
Microsoft Maia: lợi thế FP4	3x so với Trainium3	Nerd Level Tech
NVIDIA B300: hiệu suất	15 PFLOPs dense FP4	Nerd Level Tech
Huawei chip: đơn hàng lớn	Hàng trăm nghìn chip	Reuters

Sources

#	Title	URL	Ghi chú
1	The Custom AI Chip Race 2026	https://nerdleveltech.com/the-custom-ai-chip-race-2026-meta-google-amazon-microsoft-vs-nvidia	Nguồn EN, phân tích tổng quan
2	Meta's MTIA lineup	https://www.tomshardware.com/tech-industry/semiconductors/metas-mtia-chip-lineup-joins-hyperscaler-push-to-replace-nvidia-at-inference	Nguồn EN, Tom's Hardware
3	DeepSeek Huawei chip	https://techwireasia.com/2026/04/deepseek-v4-points-to-growing-use-of-huawei-chips-in-ai-models/	Nguồn EN, TechWire Asia
4	GLM-5 on Huawei Ascend	https://lushbinary.com/blog/glm-5-developer-guide-zhipu-ai-huawei-ascend-open-weight/	Nguồn EN, chi tiết kỹ thuật
5	DeepSeek Huawei specs	https://findskill.ai/blog/deepseek-v4-release-date-specs/	Nguồn EN, thông số

Cuộc đua chip AI 2026: Meta, Google, Amazon đang tự làm chip riêng — NVIDIA còn thống trị được bao lâu?

Nội dung chính

1. Tại sao tất cả đều muốn thoát khỏi NVIDIA?

2. Năm đối thủ đang thách thức NVIDIA

3. Bảng so sánh nhanh

4. NVIDIA đang ở đâu trong bức tranh này?

Điều này ảnh hưởng gì đến bạn?

Số liệu & thống kê

Sources

Bài viết liên quan

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Studio game nào đang dùng AI hiệu quả, studio nào đang thất bại? Toàn cảnh 2026

OpenAI vs. Anthropic vs. Google: ai đang giải quyết vấn đề model collapse tốt nhất?