Google ra mắt AI dịch hội thoại thời gian thực hơn 70 ngôn ngữ

(ĐTTCO) - Google ngày 10-6 công bố mô hình AI mới mang tên Gemini 3.5 Live Translate, cho phép dịch hội thoại giọng nói theo thời gian thực giữa hơn 70 ngôn ngữ, mở ra bước tiến đáng kể trong giao tiếp đa ngôn ngữ.

0:00 / 0:00
0:00
  • Nam miền Nam
  • Nữ miền Nam
  • Nữ miền Bắc
  • Nam miền Bắc
Ảnh minh họa: AI
Ảnh minh họa: AI

Theo giới thiệu, hệ thống có khả năng nhận diện ngôn ngữ và dịch gần như tức thời trong khi người dùng đang nói, đồng thời giữ được ngữ điệu, tốc độ và cao độ giọng nói. Đây là cải tiến quan trọng so với các công cụ truyền thống vốn phải chờ kết thúc câu mới xử lý, khiến hội thoại bị gián đoạn.

Công nghệ mới cho phép tạo bản dịch liên tục, giúp các cuộc trò chuyện diễn ra tự nhiên hơn. Google đã trình diễn ứng dụng trong nhiều tình huống như lồng tiếng video theo thời gian thực, dịch bài giảng và hỗ trợ giao tiếp trực tiếp giữa người dùng khác ngôn ngữ.

Trong thời gian tới, Gemini 3.5 Live Translate sẽ được tích hợp vào Google Meet, nâng số ngôn ngữ dịch trực tiếp từ 5 lên hơn 70, tạo ra hơn 2.000 tổ hợp dịch trong cùng một cuộc họp. Đáng chú ý, hệ thống không còn phụ thuộc vào tiếng Anh làm ngôn ngữ trung gian, qua đó cải thiện độ chính xác và giảm độ trễ.

Google cũng cho biết công nghệ này sẽ được triển khai trên ứng dụng Google Translate, bổ sung chế độ nghe trực tiếp trên thiết bị di động. Đồng thời, các nội dung âm thanh do AI tạo ra sẽ được gắn watermark kỹ thuật số bằng công nghệ SynthID nhằm hạn chế nguy cơ bị lạm dụng.

Các tin khác