Office365Vietnam.info
  • Back
  • AI
  • Productivity
  • Security
  • Automation
  • IT Pro
  • Theo hãng
    • Microsoft
    • Google
    • AWS
    • Anthropic
    • OpenAI
  • Hands-on Labs
  • Lộ trình học
AIAWS

Amazon Nova 2 Sonic: mô hình giọng nói thế hệ mới cho AI hội thoại

by Nam Pham5 minutes read
Amazon Nova 2 Sonic — Amazon Nova 2 Sonic: mô hình giọng nói thế hệ mới cho AI hội thoại
  • Share:
Nội dung bài viết: hide
1. Amazon Nova 2 Sonic là gì?
2. Những nâng cấp nổi bật của Nova 2 Sonic
3. Cách bắt đầu với Nova 2 Sonic
4. Ý nghĩa với doanh nghiệp Việt Nam
5. Kết luận

Amazon Nova 2 Sonic là mô hình nền tảng speech-to-speech (giọng nói sang giọng nói) thế hệ mới của AWS, vừa được công bố ở trạng thái phát hành rộng rãi (GA). Mô hình mang hội thoại giọng nói tự nhiên, thời gian thực vào ứng dụng — với chất lượng hội thoại, giá và khả năng hiểu lời nói dẫn đầu ngành. Bài viết giải thích Amazon Nova 2 Sonic là gì, các nâng cấp nổi bật và cách bắt đầu qua Amazon Bedrock.

Amazon Web Services công bố Nova 2 Sonic
Nova 2 Sonic là mô hình giọng nói thế hệ mới của AWS, dùng qua Amazon Bedrock (ảnh: Amazon Spheres, Seattle / Wikimedia Commons, CC BY-SA 4.0).

Amazon Nova 2 Sonic là gì?

AWS đã dẫn đầu công nghệ giọng nói hơn một thập kỷ. Đầu năm nay, hãng giới thiệu thế hệ đầu Nova Sonic để giải bài toán cốt lõi: tạo tương tác giọng nói thật sự mượt mà bằng cách giữ “ngữ cảnh âm học” — phản hồi không chỉ theo nội dung người dùng nói mà cả cách họ nói. Nova 2 Sonic kế thừa nền tảng đó, làm mô hình thông minh hơn, dễ tiếp cận hơn, mở rộng ngôn ngữ và bổ sung nhiều tính năng để hội thoại tự nhiên như người.

Mô hình cung cấp giọng biểu cảm — cả giọng nam và nữ trong mỗi ngôn ngữ hỗ trợ — với khả năng luân phiên lượt nói (turn-taking) tự nhiên và xử lý mượt khi người dùng ngắt lời. Đánh giá theo sở thích con người cho thấy người nghe nhất quán ưa đầu ra của Nova 2 Sonic hơn các mô hình hàng đầu khác về trải nghiệm nghe tổng thể.

Các tính năng nổi bật của Amazon Nova 2 Sonic
Sáu nhóm nâng cấp chính của Amazon Nova 2 Sonic so với thế hệ đầu (sơ đồ tự tạo).

Những nâng cấp nổi bật của Nova 2 Sonic

Hiểu lời nói tốt hơn

Khả năng nhận dạng giọng nói được tăng cường đáng kể: xử lý chính xác hơn với chuỗi chữ–số (alphanumeric), câu nói ngắn, và đầu vào điện thoại 8KHz. Mô hình cũng bền hơn trước các giọng vùng miền khác nhau và tạp âm nền — yếu tố then chốt cho triển khai thực tế.

Giọng đa ngôn ngữ (polyglot)

Ngoài tiếng Anh, Pháp, Ý, Đức và Tây Ban Nha ban đầu, Nova 2 Sonic bổ sung tiếng Bồ Đào Nha và tiếng Hindi. Đặc biệt, giọng polyglot — một giọng duy nhất có thể chuyển giữa các ngôn ngữ ngay trong cùng cuộc hội thoại (vd giọng Tiffany). Khả năng code-switching này xử lý câu pha trộn ngôn ngữ tự nhiên: ứng dụng chăm sóc khách hàng có thể bắt đầu bằng tiếng Anh rồi chuyển sang tiếng Tây Ban Nha giữa chừng mà vẫn giữ mạch và đặc trưng giọng.

Luân phiên lượt nói cấu hình được

Phát hiện hoạt động giọng nói (voice activity detection) có thể đặt cao / trung bình / thấp tuỳ ngữ cảnh: độ nhạy cao tối ưu cho phản hồi nhanh, độ nhạy thấp cho người dùng nhiều thời gian hoàn thành ý — hữu ích cho ứng dụng giáo dục hoặc người có nhu cầu giao tiếp khác nhau.

Tương tác crossmodal (giọng nói + văn bản)

Người dùng có thể chuyển giữa nhập văn bản và giọng nói trong cùng phiên, giữ nguyên ngữ cảnh: gõ một câu hỏi, nhận phản hồi bằng giọng nói, rồi tiếp tục bằng giọng nói mà không mất mạch. Có thể dùng văn bản để mô hình “nói trước” lời chào cá nhân hoá, hoặc gửi metadata phím bấm để điều hướng hệ thống IVR (vd gọi ra đặt chỗ thay người dùng).

Ứng dụng hội thoại giọng nói và trợ lý ảo
Nova 2 Sonic nhắm tới các ứng dụng hội thoại giọng nói thời gian thực, từ trợ lý ảo đến tổng đài (ảnh: Amazon Echo Dot / Wikimedia Commons, CC BY 2.0).

Đa tác nhân & gọi hàm bất đồng bộ

Nova 2 Sonic giới thiệu gọi hàm bất đồng bộ (asynchronous tool calling): khi cần gọi công cụ/dịch vụ ngoài, mô hình không dừng lại mà tiếp tục phản hồi đầu vào mới trong khi công cụ chạy nền. Ví dụ người dùng hỏi “Thời tiết thế nào?” rồi hỏi tiếp “Việc kế tiếp trong danh sách là gì?” — mô hình xử lý cả hai và trả kết quả khi từng công cụ hoàn tất.

Tích hợp tổng đài & nền tảng

Nova 2 Sonic tích hợp trực tiếp với các nhà cung cấp tổng đài hàng đầu như Amazon Connect, Vonage, Twilio, Audiocodes và nền tảng media như LiveKit, Pipecat. Các tích hợp này xử lý yêu cầu kỹ thuật phức tạp của cuộc gọi điện thoại — tối ưu codec, quản lý vòng đời phiên, xử lý sự kiện I/O hai chiều — để bạn triển khai thẳng vào hạ tầng call center sẵn có.

Cách bắt đầu với Nova 2 Sonic

Nova 2 Sonic khả dụng qua Amazon Bedrock với model ID amazon.nova-2-sonic-v1:0. Nếu đã dùng Nova Sonic, việc nâng cấp rất đơn giản: chỉ cần đổi model ID trong code hiện tại là ứng dụng hưởng ngay các cải tiến không cần cấu hình thêm. Mô hình dùng cùng API streaming hai chiều như bản gốc, nên mẫu tích hợp và code xử lý sự kiện cũ vẫn chạy; các tính năng mới (crossmodal, turn-taking cấu hình được) bật dần qua tham số/sự kiện bổ sung.

Tại thời điểm công bố, Nova 2 Sonic có ở các region US East (N. Virginia), US West (Oregon) và Asia Pacific (Tokyo), giữ mức giá–hiệu năng và độ trễ thấp dẫn đầu của bản gốc. Mô hình hỗ trợ đầy đủ tính năng bảo mật của Amazon Bedrock: mã hoá khi truyền và lưu, VPC endpoint, tích hợp AWS IAM.

Ý nghĩa với doanh nghiệp Việt Nam

Với tổ chức đang xây trợ lý giọng nói hay hiện đại hoá tổng đài, Amazon Nova 2 Sonic rút ngắn khoảng cách giữa “chatbot văn bản” và “tổng đài viên ảo” thật sự tự nhiên: hiểu giọng nói trong môi trường nhiều tạp âm, chuyển ngôn ngữ linh hoạt, và phối hợp nhiều tác vụ cùng lúc. Khả năng region Tokyo cũng giúp độ trễ tốt hơn cho khu vực châu Á. Doanh nghiệp nên rà soát kế hoạch region và chi phí token trên trang giá Bedrock trước khi triển khai diện rộng.

Tham khảo thông tin chính thức tại công bố trên AWS News Blog.

Kết luận

Amazon Nova 2 Sonic đẩy hội thoại giọng nói AI tiến một bước dài: giọng đa ngôn ngữ biểu cảm, hiểu lời nói tốt hơn, gọi hàm bất đồng bộ và tích hợp tổng đài sẵn sàng cho thực tế — tất cả qua Amazon Bedrock. Theo dõi thêm tin tức về AI, hệ sinh thái đám mây và năng suất doanh nghiệp tại Office365Vietnam.info.

Related

Tags: AI AI hội thoại Amazon Bedrock Amazon Nova 2 Sonic AWS speech-to-speech voice AI
  • Share:
Previous
AWS re:Invent 2025: Tổng hợp những công bố nổi bật nhất
6 minutes read
Next
Amazon Nova 2 Omni: Mô hình AI đa phương thức tất-cả-trong-một của AWS
4 minutes read
Nam Pham
editor

I'm a Senior Solutions Consultant, with over a decade of hands-on experience in enterprise IT. My mission is clear: empower organizations to build intelligent, AI-driven security postures while unlocking the full potential of the Microsoft ecosystem. I hold Dual Microsoft MVP recognition in Microsoft 365 Copilot and Power Platform, and I've been a Microsoft Certified Trainer (MCT) for 9+ consecutive years — a journey rooted in a deep passion for teaching, mentoring, and community building.

No comments yet! You be the first to comment.

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Danh mục:

  • AI
  • Automation
  • Hands-on Labs
  • IT Pro
  • Productivity
  • Security
  • Theo hãng
    • Anthropic
    • AWS
    • Google
    • Microsoft
    • OpenAI

Bài viết gần đây:

  • Agent Academy: Tổng quan chương trình đào tạo AI agent miễn phí của Microsoft
    Agent Academy: Tổng quan chương trình đào tạo AI agent miễn phí của Microsoft
    by Nam Pham
  • Microsoft Scout — Microsoft Scout là gì? AI Agent “luôn bật” mới cho Microsoft 365
    Microsoft Scout là gì? AI Agent “luôn bật” mới cho Microsoft 365
    by Nam Pham
  • Azure OpenAI Service — Azure OpenAI Service là gì? Hướng dẫn toàn diện cho doanh nghiệp
    Azure OpenAI Service là gì? Hướng dẫn toàn diện cho doanh nghiệp
    by Nam Pham
  • Office365Vietnam.info
    Microsoft Scout: agent ‘Autopilot’ luôn bật, tự hành động trong Microsoft 365
    by Nam Pham
  • Office365Vietnam.info
    Security Copilot agents tự động: từ quá tải cảnh báo đến hành động dứt khoát
    by Nam Pham

Office 365 Việt Nam

Blog công nghệ về AI, Productivity, Automation, và Security… trên mọi nền tảng. Cho sinh viên, người đi làm & doanh nghiệp.

Facebook-f Instagram Youtube
Theo hãng
  • Microsoft
  • Google
  • AWS
  • Anthropic
  • OpenAI
Chủ đề
  • AI
  • Productivity
  • Security
  • Automation
  • IT pro
  • Hand-on Labs
  • Lộ trình học
Khác
  • About
  • Copyright © 2026 Office365VietNam.info. All Rights Reserved.
HomeSearchAccount