Copilot Studio: computer-using agent, workflows mới và voice thời gian thực
Copilot Studio tháng 5/2026 mang tới computer-using agents (GA), trải nghiệm workflows mới trực quan, khả năng kết nối Work IQ với A2A và voice agent thời gian thực. Bài viết phân tích các cập nhật, ví dụ thực tế của Graebel và ý nghĩa với doanh nghiệp.

Kỳ vọng dành cho agent đang thay đổi rất nhanh: các đội muốn vượt khỏi trải nghiệm hội thoại, tiến tới hệ thống thực sự làm được việc — thao tác ứng dụng, chạy quy trình, phối hợp công cụ và phục vụ khách hàng tự nhiên hơn. Bản cập nhật tháng 5/2026 của Copilot Studio tập trung đúng vào đó: computer-using agents chính thức ra mắt rộng rãi (GA), trải nghiệm workflows mới, khả năng kết nối qua Work IQ và voice agent thời gian thực. Bài viết điểm qua chi tiết.
Computer-using agents chính thức GA
Tự động hoá truyền thống chạy tốt trong môi trường ổn định, nhưng nhiều quy trình thực tế thì không: giao diện thay đổi, cổng thông tin nhà cung cấp cập nhật bất ngờ, hệ thống cũ không có API. Computer-using agents sinh ra để lấp khoảng trống đó — và nay đã generally available trong Copilot Studio.
Tổ chức có thể xây agent thao tác trực tiếp với website và ứng dụng desktop qua giao diện (UI), tự động hoá những quy trình trước đây phải dựa vào script dễ vỡ hoặc làm thủ công. Bản phát hành mới còn kèm năng lực cấp doanh nghiệp: quản lý thông tin đăng nhập an toàn hơn, chọn mô hình phù hợp từng kịch bản, và xây tự động hoá bền bỉ, thích ứng khi giao diện đổi thay vì gãy mỗi khi màn hình thay đổi. Computer-using agents cũng có thể nhúng thẳng vào workflows nhiều bước (đang ở giai đoạn preview).

Trải nghiệm workflows mới, trực quan hơn
Khi mở rộng quy mô, các đội cần cách điều phối nhiều tự động hoá sao cho dễ hiểu, dễ bảo trì. Trải nghiệm workflows được thiết kế lại (có trong môi trường early release) mang tới trình thiết kế trực quan trên một canvas thống nhất, để bạn thấy rõ cách các hành động, quyết định và bước AI phối hợp trong một quy trình nghiệp vụ.
Thành phần cốt lõi là khả năng thêm agent có sẵn vào workflow qua các “agent node”. Khi workflow gặp một quyết định không thể gói trong logic if-then đơn giản — cần suy luận theo ngữ cảnh, điều phối công cụ hay truy xuất tri thức từ nhiều nguồn — agent node sẽ bắc cầu. Trình thiết kế mới còn có cấu hình inline, khối dựng đơn giản và kiểm thử ở cấp node để xác thực hành vi sớm. Kết quả: kết hợp điều phối tất định với thực thi thích ứng — chặt chẽ nơi cần, linh hoạt nơi đáng.

Ví dụ thực tế: Graebel
Graebel — công ty toàn cầu về dịch chuyển nhân tài — xử lý hàng nghìn yêu cầu chuyển công tác mỗi năm, phần lớn là email phi cấu trúc đầy chỉ dẫn riêng và ngoại lệ. Nền tảng Global Connect của họ không có API nên các nỗ lực tự động hoá trước đây quá cứng nhắc. Cùng GET AI và Microsoft, Graebel xây Service Order Agent trên Copilot Studio dùng computer use: agent đọc email, kiểm tra theo quy tắc nghiệp vụ, vận hành Global Connect qua UI và đẩy ngoại lệ qua workflow khi cần. Agent đã chạy thực tế, thiết kế để mở rộng hơn 30 nhóm dịch vụ, giúp giảm công thủ công, xử lý nhanh hơn và dữ liệu nhất quán hơn.
Kết nối hệ thống với Work IQ và agent tương tác
Một agent dù mạnh cũng bị giới hạn nếu hoạt động đơn lẻ. Các năng lực tương tác (interoperability) và mở rộng của Work IQ giúp agent, workflow và công cụ doanh nghiệp làm việc cùng nhau xuyên môi trường. Với Work IQ REST API và CLI mới, các đội tích hợp Work IQ linh hoạt hơn vào quy trình vận hành và phát triển sẵn có. Hỗ trợ remote MCP server mang tới cách chuẩn hoá để kết nối agent với công cụ, dịch vụ và tài nguyên doanh nghiệp, giảm nhu cầu tích hợp thủ công.
Đặc biệt, giao tiếp agent-to-agent (A2A) nay đã GA trong Copilot Studio: các agent có thể trao đổi thông tin, giao việc cho nhau và phối hợp hiệu quả hơn xuyên hệ thống và workflow — tiếp tục dịch chuyển từ trải nghiệm AI rời rạc sang nền tảng vận hành kết nối.

Voice agent thời gian thực cho chăm sóc khách hàng
Thoại vẫn là kênh khó hiện đại hoá nhất: khách bị kẹt trong cây thoại cứng nhắc, phải lặp lại thông tin, mất ngữ cảnh khi chuyển sang nhân viên. Real-time voice agents nay đã GA tại Bắc Mỹ qua Dynamics 365 Contact Center, giúp xây trải nghiệm thoại tự nhiên: nhận diện người gọi, trả lời câu hỏi, hành động ngay trong cuộc gọi và chuyển sang nhân viên mà vẫn giữ ngữ cảnh. Hỗ trợ thoại server-to-server (S2S) giúp kết nối voice agent vào hệ thống dịch vụ sẵn có. Microsoft cũng phát hành hướng dẫn quản trị chuyên sâu cho voice agent (kiểm thử leo thang, giám sát, bảo mật, tuân thủ).
Các cập nhật đáng chú ý khác
- Lớp điều phối (orchestration) mới: dựa trên AI stack nâng cấp, Microsoft cho biết cải thiện hiệu năng đánh giá khoảng 20% và giảm 50% lượng token tiêu thụ ròng, giúp agent hoàn thành tác vụ ổn định và tiết kiệm hơn (theo dữ liệu sử dụng của Microsoft, 2026).
- Hiển thị vòng đời agent: cả đội dễ nắm trạng thái phê duyệt và xuất bản — agent đang tạo, sẵn sàng kiểm thử, đã publish hay gặp lỗi — giảm phỏng đoán khi phát triển và vận hành ở quy mô lớn.
Ý nghĩa với doanh nghiệp Việt Nam
Với tổ chức đang dùng Microsoft 365 và Power Platform, các cập nhật này mở đường tự động hoá những quy trình từng bị bỏ qua vì hệ thống cũ không có API — đặc biệt hữu ích cho doanh nghiệp Việt Nam còn nhiều phần mềm nội bộ hoặc cổng nhà cung cấp không API. Khi triển khai computer use và voice agent, nên ưu tiên quản trị: thông tin đăng nhập an toàn, kiểm thử leo thang và giám sát. Một số tính năng đang ở early release/preview hoặc giới hạn khu vực (voice GA tại Bắc Mỹ), nên cần theo dõi lộ trình trước khi đưa vào sản xuất.
Kết luận
Bản cập nhật tháng 5/2026 cho thấy Copilot Studio ngày càng trở thành nền tảng agent toàn diện: thao tác được hệ thống không API, điều phối workflow trực quan, kết nối qua Work IQ/A2A và phục vụ khách hàng bằng giọng nói thời gian thực. Mục tiêu xuyên suốt là giúp tổ chức xây hệ thống dễ kết nối, dễ thích ứng và dễ vận hành ở quy mô lớn mà không đánh mất cấu trúc, khả năng quan sát và quản trị.
Theo dõi Office365Vietnam.info để cập nhật các phân tích mới nhất về Microsoft 365, Copilot và hệ sinh thái AI doanh nghiệp.
