Câu chuyện từ một buổi code review
Tuần trước, ông bạn tôi - tech lead một team .NET ở một fintech startup - nhắn vào lúc 11 giờ đêm:
"Ông ơi, thằng junior trên team tôi vừa bảo 'anh ơi em để Copilot viết cái PR này, nó tự resolve issue và commit luôn rồi'. Tôi không biết có nên vui hay lo đây."
Tôi trả lời: "Vui đi. Nhưng nhớ đọc diff kỹ trước khi merge."
Câu chuyện đó đọng lại trong đầu tôi cả tuần. Không phải vì chuyện junior dùng AI - cái đó tôi đã thấy từ lâu. Mà vì Copilot Agent Mode đã GA rồi. Không còn là demo nữa. Không còn là beta nữa. Nó đang chạy thật trên production workflows của teams thật.
Và đó chỉ là một trong cả chục thứ Microsoft vừa ship trong 3 tháng đầu 2026.
Microsoft vừa làm gì vậy?
Để tôi tóm gọn lại những gì đã xảy ra từ cuối 2025 đến tháng 3/2026, theo góc nhìn của một người làm .NET architecture lâu năm:
1. GitHub Copilot Agent Mode - GA tháng 1-2/2026
Đây là cái tôi thấy impactful nhất với daily workflow của developer.
Trước đây Copilot chỉ autocomplete và explain code. Bây giờ ở Agent Mode, nó có thể:
- Đọc một GitHub Issue
- Tự viết code fix
- Tạo PR với description đầy đủ
- Và... chờ bạn review
60 triệu code review mỗi tháng qua Copilot - đó là con số Microsoft công bố. Không phải suggest code - review code.
Cái tôi thấy thú vị là cách nó thay đổi workflow. Trước: dev viết code → tạo PR → reviewer comment. Bây giờ: dev describe intent → Agent Mode viết draft → dev review chính code của AI. Vai trò đảo lộn, nhưng theo hướng tốt hơn nếu bạn biết đọc code của AI.
2. Phi-4-Reasoning - Model 15B chạy được local
Ngày 4/3/2026, Microsoft release Phi-4-Reasoning - một model 15 tỷ parameters nhưng benchmark ngang ngửa với các model 100B+.
Tại sao tôi care? Vì nó chạy được local. Trên laptop bình thường. Không cần GPU cloud. Không tốn tiền Azure mỗi request.
Với teams làm việc trên dữ liệu nhạy cảm - fintech, healthcare, enterprise internal tools - đây là game changer. Bạn có thể chạy reasoning model ngay trên máy dev, trong air-gapped environment, mà không cần gửi data ra ngoài.
Kết hợp với Windows AI Foundry (expected Q2/2026) - local LLM management với ONNX inferencing - Microsoft đang build một stack AI chạy được hoàn toàn offline.
3. Azure AI Foundry Agent Service - GA
Nếu Phi-4 là câu trả lời cho "chạy local thế nào", thì Foundry là câu trả lời cho "orchestrate nhiều AI agent trong production thế nào".
Azure AI Foundry Agent Service đã GA (General Availability) ở Build 2025 và tiếp tục được cập nhật trong Q1/2026. Nó hỗ trợ:
- Multi-agent orchestration - nhiều agent phối hợp nhau
- MCP (Model Context Protocol) - chuẩn mở để define tools cho AI
- A2A Protocol - agent-to-agent communication
- Voice integration (preview)
Đây là infrastructure layer cho những team muốn build production-grade AI workflows, không chỉ demo.
4. Semantic Kernel 1.0 RC - Framework .NET native
Đây là cái tôi theo dõi sát nhất vì nó ảnh hưởng trực tiếp đến codebase C#.
Semantic Kernel đang trong giai đoạn 1.0 RC, với:
- Multi-agent collaboration built-in
- Streaming support
- Observability (logs, traces, metrics theo chuẩn OpenTelemetry)
- .NET là first-class citizen - không phải Python port
Tôi đã thử SK trong một internal tool nhỏ. Cảm giác khá tự nhiên nếu bạn đã quen với DI và middleware pattern của ASP.NET Core. Concepts như Kernel, Plugin, Function mapping khá rõ với cách .NET dev suy nghĩ.
Quay lại chuyện kỹ thuật: Cái gì đang thực sự thay đổi?
Nhìn tổng thể, tôi thấy Microsoft đang xây ba lớp:
┌─────────────────────────────────────────┐
│ Application Layer │
│ GitHub Copilot Agent Mode │
│ Microsoft 365 Copilot (E7 Suite) │
├─────────────────────────────────────────┤
│ Orchestration Layer │
│ Azure AI Foundry Agent Service │
│ Semantic Kernel 1.0 RC │
│ Model Context Protocol (MCP) │
├─────────────────────────────────────────┤
│ Model Layer │
│ Phi-4 / Phi-4-Reasoning │
│ Claude Opus/Sonnet (via Foundry) │
│ GPT-4o (via Foundry) │
│ Windows AI Foundry (local inference) │
└─────────────────────────────────────────┘
Điều thú vị là ba lớp này không bắt buộc phải dùng chung. Bạn có thể:
- Chỉ dùng Copilot Agent Mode cho team workflow
- Chỉ dùng Foundry + Semantic Kernel cho backend AI features
- Chỉ dùng Phi-4 local cho inference không muốn cloud
Không phải lock-in kiểu cũ - "dùng Azure thì phải dùng hết Azure". Đây là sự thay đổi tôi thấy rõ.
Kinh nghiệm thực tế: Tôi đang thấy gì ở các dự án?
Vài tháng gần đây tôi tư vấn cho 2-3 teams đang làm AI integration trong .NET stack. Một số pattern tôi thấy xuất hiện:
Pattern 1: Semantic Kernel cho internal chatbot
Team xây internal chatbot hỏi về policy, procedure bằng Semantic Kernel + Azure OpenAI. Deploy trên Azure, tích hợp với Active Directory. Semantic Kernel handle plugin calls (search SharePoint, query SQL Server), GPT-4o handle response generation.
Chi phí: khoảng $5-15K/tháng tùy usage. Cao hơn self-hosted nhưng zero ops overhead.
Pattern 2: Phi-4 cho data validation
Một team fintech dùng Phi-4 chạy local để validate và classify transaction descriptions trước khi đưa vào pipeline. Lý do: dữ liệu giao dịch không được gửi ra cloud theo compliance requirement. Phi-4 chạy được trên server on-premise, accuracy đủ cho use case của họ.
Pattern 3: Foundry Agent cho e-commerce workflow
Team e-commerce đang POC multi-agent: agent 1 handle customer intent, agent 2 query catalog, agent 3 generate personalized response. Dùng Azure AI Foundry để orchestrate. MCP để define tool schema. Còn sớm nhưng đang promising.
Cái tôi thực sự muốn nói
Tôi đã thấy nhiều wave "revolution" trong 20 năm làm nghề này. Mỗi lần cũng có cùng một pattern: ra mắt ồn ào → hype đến đỉnh → hype xì hơi → useful subset tồn tại và integrate vào mainstream.
AI thì khác ở chỗ: tốc độ của giai đoạn integration nhanh hơn bao giờ hết.
GitHub Copilot ra mắt năm 2021. Năm 2026 - tức là chỉ 5 năm - nó đã Agent Mode, đã viết PR tự động, đã 60 triệu code review mỗi tháng. Semantic Kernel bắt đầu từ một Microsoft Research project - giờ nó đang tiến đến 1.0 GA.
Cái tôi muốn nói với các bạn đang theo dõi bài này, đặc biệt các bạn đang cân nhắc "có nên invest thời gian vào mấy thứ này không":
Không phải "có nên" nữa. Câu hỏi bây giờ là "integrate ở lớp nào và mức độ sâu nào".
Nếu bạn làm .NET architect, tôi suggest bắt đầu với Semantic Kernel - vì nó native .NET, concept tương tự những gì bạn đã biết, và đang approach GA. Bắt đầu với một plugin đơn giản, một workflow nhỏ. Đừng nhảy vào multi-agent ngay - hãy hiểu primitives trước.
Nếu bạn làm team lead, GitHub Copilot Agent Mode là thứ nên thử ngay trong team workflow. Không phải để thay dev - mà để giải phóng dev khỏi những task lặp lại và focus vào những thứ thực sự cần human judgment.
Và nếu bạn đang làm với dữ liệu sensitive: để mắt đến Phi-4 và Windows AI Foundry. Local inference không còn là giấc mơ xa vời nữa.
Gửi các bạn trẻ đang đọc bài này
Tôi biết nhiều bạn đang cảm thấy overwhelmed. Microsoft release liên tục, tool mới mỗi tuần, không biết follow cái gì.
Lời khuyên của tôi: đừng cố follow tất cả. Chọn một vertical phù hợp với dự án bạn đang làm, đào sâu vào đó. Hiểu nó thực sự hoạt động như thế nào - không chỉ "dùng được" mà là "biết tại sao nó hoạt động".
Copilot Agent Mode viết được PR không có nghĩa bạn không cần hiểu code. Nó có nghĩa bạn cần hiểu code ở tầng cao hơn - để review AI code tốt hơn chính AI.
Cái "believe in basic" của tôi lúc này là: AI tools rất hay, nhưng người hiểu system design và software principles sâu sẽ dùng AI tốt hơn người chỉ biết gõ prompt.
Bạn đang dùng gì trong team?
Các bạn đang integrate Microsoft AI stack theo hướng nào? Semantic Kernel? Copilot Agent? Hay vẫn còn đang wait-and-see?
Tôi thực sự tò mò về những use case thực tế - vì mấy cái hay nhất thường không xuất hiện trong blog chính thức của Microsoft :D
/Son Do - believe in basic
#1percentbetter #dotnet #aiarchitecture #microsoftai #semantickernel #githubcopilot