WEBSITE ĐANG PHÁT TRIỂN

Phi-4 chạy được trên laptop, Copilot Agent Mode tự viết PR - Microsoft đang build hệ sinh thái AI cho dev .NET thật sự rồi đây

Microsoft vừa đồng loạt ship một loạt sản phẩm AI trong Q1/2026 - từ Phi-4 chạy local không tốn cloud, đến GitHub Copilot Agent Mode tự resolve issue và tạo PR, đến Azure AI Foundry GA cho production. Là dev .NET 20 năm, tôi thấy đây là lần đầu tiên Microsoft không chỉ ra mắt feature - họ đang xây cả một hệ sinh thái.

Câu chuyện từ một buổi code review

Tuần trước, ông bạn tôi - tech lead một team .NET ở một fintech startup - nhắn vào lúc 11 giờ đêm:

"Ông ơi, thằng junior trên team tôi vừa bảo 'anh ơi em để Copilot viết cái PR này, nó tự resolve issue và commit luôn rồi'. Tôi không biết có nên vui hay lo đây."

Tôi trả lời: "Vui đi. Nhưng nhớ đọc diff kỹ trước khi merge."

Câu chuyện đó đọng lại trong đầu tôi cả tuần. Không phải vì chuyện junior dùng AI - cái đó tôi đã thấy từ lâu. Mà vì Copilot Agent Mode đã GA rồi. Không còn là demo nữa. Không còn là beta nữa. Nó đang chạy thật trên production workflows của teams thật.

Và đó chỉ là một trong cả chục thứ Microsoft vừa ship trong 3 tháng đầu 2026.


Microsoft vừa làm gì vậy?

Để tôi tóm gọn lại những gì đã xảy ra từ cuối 2025 đến tháng 3/2026, theo góc nhìn của một người làm .NET architecture lâu năm:

1. GitHub Copilot Agent Mode - GA tháng 1-2/2026

Đây là cái tôi thấy impactful nhất với daily workflow của developer.

Trước đây Copilot chỉ autocomplete và explain code. Bây giờ ở Agent Mode, nó có thể:

  • Đọc một GitHub Issue
  • Tự viết code fix
  • Tạo PR với description đầy đủ
  • Và... chờ bạn review

60 triệu code review mỗi tháng qua Copilot - đó là con số Microsoft công bố. Không phải suggest code - review code.

Cái tôi thấy thú vị là cách nó thay đổi workflow. Trước: dev viết code → tạo PR → reviewer comment. Bây giờ: dev describe intent → Agent Mode viết draft → dev review chính code của AI. Vai trò đảo lộn, nhưng theo hướng tốt hơn nếu bạn biết đọc code của AI.

2. Phi-4-Reasoning - Model 15B chạy được local

Ngày 4/3/2026, Microsoft release Phi-4-Reasoning - một model 15 tỷ parameters nhưng benchmark ngang ngửa với các model 100B+.

Tại sao tôi care? Vì nó chạy được local. Trên laptop bình thường. Không cần GPU cloud. Không tốn tiền Azure mỗi request.

Với teams làm việc trên dữ liệu nhạy cảm - fintech, healthcare, enterprise internal tools - đây là game changer. Bạn có thể chạy reasoning model ngay trên máy dev, trong air-gapped environment, mà không cần gửi data ra ngoài.

Kết hợp với Windows AI Foundry (expected Q2/2026) - local LLM management với ONNX inferencing - Microsoft đang build một stack AI chạy được hoàn toàn offline.

3. Azure AI Foundry Agent Service - GA

Nếu Phi-4 là câu trả lời cho "chạy local thế nào", thì Foundry là câu trả lời cho "orchestrate nhiều AI agent trong production thế nào".

Azure AI Foundry Agent Service đã GA (General Availability) ở Build 2025 và tiếp tục được cập nhật trong Q1/2026. Nó hỗ trợ:

  • Multi-agent orchestration - nhiều agent phối hợp nhau
  • MCP (Model Context Protocol) - chuẩn mở để define tools cho AI
  • A2A Protocol - agent-to-agent communication
  • Voice integration (preview)

Đây là infrastructure layer cho những team muốn build production-grade AI workflows, không chỉ demo.

4. Semantic Kernel 1.0 RC - Framework .NET native

Đây là cái tôi theo dõi sát nhất vì nó ảnh hưởng trực tiếp đến codebase C#.

Semantic Kernel đang trong giai đoạn 1.0 RC, với:

  • Multi-agent collaboration built-in
  • Streaming support
  • Observability (logs, traces, metrics theo chuẩn OpenTelemetry)
  • .NET là first-class citizen - không phải Python port

Tôi đã thử SK trong một internal tool nhỏ. Cảm giác khá tự nhiên nếu bạn đã quen với DI và middleware pattern của ASP.NET Core. Concepts như Kernel, Plugin, Function mapping khá rõ với cách .NET dev suy nghĩ.


Quay lại chuyện kỹ thuật: Cái gì đang thực sự thay đổi?

Nhìn tổng thể, tôi thấy Microsoft đang xây ba lớp:

┌─────────────────────────────────────────┐
│  Application Layer                       │
│  GitHub Copilot Agent Mode              │
│  Microsoft 365 Copilot (E7 Suite)       │
├─────────────────────────────────────────┤
│  Orchestration Layer                     │
│  Azure AI Foundry Agent Service         │
│  Semantic Kernel 1.0 RC                 │
│  Model Context Protocol (MCP)           │
├─────────────────────────────────────────┤
│  Model Layer                             │
│  Phi-4 / Phi-4-Reasoning               │
│  Claude Opus/Sonnet (via Foundry)       │
│  GPT-4o (via Foundry)                  │
│  Windows AI Foundry (local inference)  │
└─────────────────────────────────────────┘

Điều thú vị là ba lớp này không bắt buộc phải dùng chung. Bạn có thể:

  • Chỉ dùng Copilot Agent Mode cho team workflow
  • Chỉ dùng Foundry + Semantic Kernel cho backend AI features
  • Chỉ dùng Phi-4 local cho inference không muốn cloud

Không phải lock-in kiểu cũ - "dùng Azure thì phải dùng hết Azure". Đây là sự thay đổi tôi thấy rõ.


Kinh nghiệm thực tế: Tôi đang thấy gì ở các dự án?

Vài tháng gần đây tôi tư vấn cho 2-3 teams đang làm AI integration trong .NET stack. Một số pattern tôi thấy xuất hiện:

Pattern 1: Semantic Kernel cho internal chatbot

Team xây internal chatbot hỏi về policy, procedure bằng Semantic Kernel + Azure OpenAI. Deploy trên Azure, tích hợp với Active Directory. Semantic Kernel handle plugin calls (search SharePoint, query SQL Server), GPT-4o handle response generation.

Chi phí: khoảng $5-15K/tháng tùy usage. Cao hơn self-hosted nhưng zero ops overhead.

Pattern 2: Phi-4 cho data validation

Một team fintech dùng Phi-4 chạy local để validate và classify transaction descriptions trước khi đưa vào pipeline. Lý do: dữ liệu giao dịch không được gửi ra cloud theo compliance requirement. Phi-4 chạy được trên server on-premise, accuracy đủ cho use case của họ.

Pattern 3: Foundry Agent cho e-commerce workflow

Team e-commerce đang POC multi-agent: agent 1 handle customer intent, agent 2 query catalog, agent 3 generate personalized response. Dùng Azure AI Foundry để orchestrate. MCP để define tool schema. Còn sớm nhưng đang promising.


Cái tôi thực sự muốn nói

Tôi đã thấy nhiều wave "revolution" trong 20 năm làm nghề này. Mỗi lần cũng có cùng một pattern: ra mắt ồn ào → hype đến đỉnh → hype xì hơi → useful subset tồn tại và integrate vào mainstream.

AI thì khác ở chỗ: tốc độ của giai đoạn integration nhanh hơn bao giờ hết.

GitHub Copilot ra mắt năm 2021. Năm 2026 - tức là chỉ 5 năm - nó đã Agent Mode, đã viết PR tự động, đã 60 triệu code review mỗi tháng. Semantic Kernel bắt đầu từ một Microsoft Research project - giờ nó đang tiến đến 1.0 GA.

Cái tôi muốn nói với các bạn đang theo dõi bài này, đặc biệt các bạn đang cân nhắc "có nên invest thời gian vào mấy thứ này không":

Không phải "có nên" nữa. Câu hỏi bây giờ là "integrate ở lớp nào và mức độ sâu nào".

Nếu bạn làm .NET architect, tôi suggest bắt đầu với Semantic Kernel - vì nó native .NET, concept tương tự những gì bạn đã biết, và đang approach GA. Bắt đầu với một plugin đơn giản, một workflow nhỏ. Đừng nhảy vào multi-agent ngay - hãy hiểu primitives trước.

Nếu bạn làm team lead, GitHub Copilot Agent Mode là thứ nên thử ngay trong team workflow. Không phải để thay dev - mà để giải phóng dev khỏi những task lặp lại và focus vào những thứ thực sự cần human judgment.

Và nếu bạn đang làm với dữ liệu sensitive: để mắt đến Phi-4 và Windows AI Foundry. Local inference không còn là giấc mơ xa vời nữa.


Gửi các bạn trẻ đang đọc bài này

Tôi biết nhiều bạn đang cảm thấy overwhelmed. Microsoft release liên tục, tool mới mỗi tuần, không biết follow cái gì.

Lời khuyên của tôi: đừng cố follow tất cả. Chọn một vertical phù hợp với dự án bạn đang làm, đào sâu vào đó. Hiểu nó thực sự hoạt động như thế nào - không chỉ "dùng được" mà là "biết tại sao nó hoạt động".

Copilot Agent Mode viết được PR không có nghĩa bạn không cần hiểu code. Nó có nghĩa bạn cần hiểu code ở tầng cao hơn - để review AI code tốt hơn chính AI.

Cái "believe in basic" của tôi lúc này là: AI tools rất hay, nhưng người hiểu system design và software principles sâu sẽ dùng AI tốt hơn người chỉ biết gõ prompt.


Bạn đang dùng gì trong team?

Các bạn đang integrate Microsoft AI stack theo hướng nào? Semantic Kernel? Copilot Agent? Hay vẫn còn đang wait-and-see?

Tôi thực sự tò mò về những use case thực tế - vì mấy cái hay nhất thường không xuất hiện trong blog chính thức của Microsoft :D


/Son Do - believe in basic

#1percentbetter #dotnet #aiarchitecture #microsoftai #semantickernel #githubcopilot



Bài viết liên quan

Xem thêm
AI Integration — Góc nhìn Architect

Prompt Engineering 2026: Không phải 1 góc nhìn — mà 40 góc nhìn song song

Năm 2026, AI agents đang bùng nổ và nhiều người vội vã tuyên bố "prompt engineering đã chết". Sai hoàn toàn. Chain of Thought, flipping roles — những kỹ thuật cơ bản đó vẫn còn sống, chỉ là giờ chúng ta không chạy 1 luồng nữa, mà chạy song song 40 luồng cùng lúc. Bài này là câu chuyện về sự tiến hóa đó. Hôm rồi tôi ngồi cà phê với một ông bạn — tôi gọi anh là Khoa cho tiện — senior developer 6 năm, đang chuyển sang làm AI engineer ở một startup khá hot trong nước. Anh mở màn bằng một câu khiến tôi suýt đổ cà phê: "Anh ơi, prompt engineering giờ chết rồi. Giờ phải học AI agents mới là đúng hướng." Tôi nhìn anh, hỏi: "Chết theo nghĩa nào?" Anh giải thích: "Thì giờ người ta build hệ thống multi-agent rồi, AI tự lo với nhau, mình chỉ cần thiết kế workflow là xong. Ai còn ngồi viết prompt thủ công nữa?" Tôi im lặng một lúc, rồi hỏi ngược: "Thế mấy cái agent đó nó tự nhiên biết làm việc không? Hay vẫn cần ai đó chỉ cho nó cách nghĩ?" Anh Khoa dừng lại. Ừ nhỉ.

AI Integration — Góc nhìn Architect

Ba cấp độ làm việc với AI: automation, augmentation, và agency - bạn đang ở đâu?

Hầu hết developer đang dùng AI chỉ một cách: giao việc và chờ kết quả. Nhưng có hai cách hiệu quả hơn nhiều - và một trong số đó có thể thay đổi hoàn toàn cách bạn làm việc. Bài này là framework tôi dùng để tự đánh giá mình đang khai thác AI đến đâu. Tuần trước tôi ngồi cà phê với một anh bạn - senior developer 8 năm kinh nghiệm, tôi gọi là anh Hưng cho dễ. Anh vừa xong một sprint khá nặng, và câu đầu tiên mở miệng là: "Mày ơi, giờ tao làm việc với AI nhiều lắm, năng suất tăng rõ rệt." Tôi gật đầu, hỏi tiếp: "Bạn đang dùng theo cách nào?" Anh Hưng giải thích: ChatGPT để viết unit test. GitHub Copilot để gợi ý code. Claude để explain stack trace. Ổn đấy. Tôi hỏi tiếp: "Còn ngoài ra?" Anh im lặng một lúc. "Ngoài ra là... mình hỏi nó trả lời, xong mình copy, sửa lại, done." Câu đó làm tôi nghĩ nhiều. Không phải vì anh Hưng dùng AI sai - mà vì câu đó mô tả chính xác cách phần lớn developer giỏi đang bỏ lỡ hai phần ba giá trị của AI.