Google ra mắt AI dịch hội thoại trực tiếp bằng hơn 70 ngôn ngữ, có tiếng Việt

Google vừa trình làng Gemini 3.5 Live Translate, công nghệ AI có khả năng dịch giọng nói theo thời gian thực và giữ lại nhiều đặc điểm của giọng nói gốc trong quá trình chuyển ngữ.
Gemini - Ảnh 1.

Live Translate giúp xóa bỏ rào cản ngôn ngữ trong giao tiếp hằng ngày - Ảnh: GOOGLE

Phiên dịch giọng nói theo thời gian thực không phải khái niệm mới, nhưng các công cụ hiện nay vẫn gặp nhiều thách thức như độ trễ khi chuyển ngữ, khó hiểu đúng ngữ cảnh hoặc khiến cuộc trò chuyện bị ngắt quãng. 

Với Gemini 3.5 Live Translate, Google kỳ vọng thu hẹp những hạn chế này, giúp các cuộc hội thoại giữa người dùng sử dụng ngôn ngữ khác nhau diễn ra liền mạch và tự nhiên hơn.

Gemini 3.5 Live Translate khác gì so với các công cụ dịch trước đây?

Trước khi Gemini 3.5 Live Translate xuất hiện, người dùng đã có thể sử dụng Google Translate để hỗ trợ các cuộc hội thoại giữa nhiều ngôn ngữ khác nhau. Tuy nhiên trải nghiệm giao tiếp xuyên ngôn ngữ vẫn còn một số hạn chế về độ trễ và tính tự nhiên của bản dịch.

Vì vậy dù giúp thu hẹp rào cản ngôn ngữ, các công cụ dịch hội thoại hiện nay vẫn khó mang lại trải nghiệm liền mạch như giao tiếp trực tiếp. Những khoảng trễ trong quá trình xử lý cùng cách thể hiện giọng nói của bản dịch khiến cuộc hội thoại trở nên kém tự nhiên hơn.

Google cho biết Gemini 3.5 Live Translate được phát triển nhằm khắc phục những điểm yếu đó. Công nghệ mới có khả năng xử lý và tạo bản dịch gần như theo thời gian thực, giúp giảm độ trễ trong quá trình giao tiếp. 

Bên cạnh việc chuyển đổi nội dung từ ngôn ngữ này sang ngôn ngữ khác, hệ thống còn được thiết kế để duy trì một số đặc điểm trong giọng nói của người dùng như nhịp điệu, ngữ điệu và cảm xúc.

Theo Google, Gemini 3.5 Live Translate hiện hỗ trợ hơn 70 ngôn ngữ, trong đó có tiếng Việt. Công nghệ này được tích hợp vào các sản phẩm như Google Translate, Google Meet và Gemini API, cho thấy tham vọng của hãng trong việc đưa dịch thuật AI trở thành một phần của giao tiếp hằng ngày.

Công nghệ mở ra cách giao tiếp mới trong đời sống

Video tài xế Grab và khách hàng trao đổi trực tiếp qua điện thoại dù không sử dụng cùng ngôn ngữ - Video: GOOGLE

Sự phát triển của dịch giọng nói theo thời gian thực đang dần thay đổi cách con người giao tiếp trong môi trường đa ngôn ngữ, từ du lịch, công việc cho đến học tập.

Trong các chuyến đi nước ngoài, người dùng có thể trò chuyện trực tiếp với người bản địa trong những tình huống cơ bản như hỏi đường, đặt dịch vụ hay mua sắm mà không cần thông thạo ngôn ngữ địa phương. Việc trao đổi trở nên nhanh hơn và ít phụ thuộc vào các công cụ dịch thủ công hơn trước.

Trong môi trường làm việc toàn cầu, đặc biệt là các cuộc họp trực tuyến, công nghệ này có thể giúp giảm rào cản ngôn ngữ, từ đó hỗ trợ quá trình trao đổi thông tin diễn ra liền mạch hơn giữa các bên tham gia đến từ nhiều quốc gia.

Ở lĩnh vực giáo dục, dịch giọng nói thời gian thực cũng mở ra cách tiếp cận mới trong việc học ngoại ngữ, khi người học có thể luyện phản xạ nghe nói trong các tình huống giao tiếp gần với thực tế hơn.

Dù vẫn còn nhiều thách thức cần hoàn thiện, sự xuất hiện của các công nghệ như Gemini 3.5 Live Translate cho thấy xu hướng rõ ràng: rào cản ngôn ngữ trong tương lai có thể được thu hẹp đáng kể, giúp việc giao tiếp giữa con người trở nên tự nhiên và dễ dàng hơn.

Đọc tiếp Về trang Chủ đề