Cuộc thi Vietnamese Language and Speech Processing - VLSP thuộc khuôn khổ hội thảo quốc tế thường niên về Xử lý ngôn ngữ và Tiếng nói tiếng Việt do câu lạc bộ VLSP, chi hội của Hội Tin học Việt Nam tổ chức. VLSP 2023 tổ chức 10 cuộc thi về xử lý tiếng nói và xử lý văn bản, quy tụ các nhà nghiên cứu, chuyên gia và đơn vị phát triển công nghệ hàng đầu. Tham gia Vietnamese Language and Speech Processing 2023, Viettel AI thắng lớn với giải Nhất tại 2 hạng mục Nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói; Dịch máy Việt - Lào. 

Trong đó, Nhận dạng tiếng nói (Automatic Speech Recognition) là một trong những bài toán quan trọng của xử lý tiếng nói nhằm chuyển đổi tín hiệu tiếng nói đầu vào thành văn bản tương ứng. Năm nay, với điểm đổi mới trong cơ cấu các hạng mục của cuộc thi, các đội thi đã phải thực hiện cùng lúc hai bài toán về nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói. Viettel AI không chỉ vượt qua thử thách này để giành giải nhất, mà còn gây ấn tượng về điểm số vượt trội là 89,18% (các đội theo sau lần lượt là 83,40% và 78,45%).

Theo đại diện Viettel AI, điểm then chốt dẫn đến kết quả vượt trội về độ chính xác này là bởi Viettel AI đã làm chủ công nghệ từ sớm. Thay vì sử dụng mô hình từ các kết quả nghiên cứu có sẵn, Viettel AI đã tự phát triển từ đầu một mô hình dành riêng cho xử lý tiếng nói tiếng Việt và liên tục cập nhật, tối ưu hiệu quả. Kết hợp với việc thiết lập chu trình huấn luyện có thể xử lý toàn bộ dữ liệu ở các điều kiện chất lượng khác nhau, các kỹ sư đã thành công xây dựng mô hình nhận dạng được cả văn bản và cảm xúc của câu nói với độ chính xác cao, trong điều kiện dữ liệu hạn chế.

aaaaaaaaaa.jpg
Các kỹ sư Khối Nền tảng Trợ lý ảo, Viettel AI tham gia hạng mục Nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói

Công nghệ Xử lý tiếng nói tiên tiến đã mang lại những hiệu quả đáng kể cho các sản phẩm của Viettel AI như hệ thống trợ lý ảo, tổng đài ảo có thể nhận dạng giọng nói chính xác đến 95% và nhận diện ý định của khách hàng chính xác lên tới 96%. Đặc biệt, kết quả nghiên cứu công nghệ về nhận diện tiếng nói và cảm xúc từ cuộc thi sẽ mở ra những ứng dụng mới trong việc chăm sóc khách hàng, khai thác thông tin từ các cuộc gọi tổng đài… Những cuộc gọi phàn nàn, tiêu cực từ khách hàng gọi lên tổng đài thường chiếm số ít trong hàng trăm nghìn cuộc gọi lên tổng đài trợ giúp mỗi ngày nhưng có ảnh hưởng lớn đến chất lượng dịch vụ. Thay vì tốn chi phí thuê người nghe lại và đánh dấu những cuộc gọi này như trước đây, tổng đài ảo Viettel Cyberbot sẽ có thể tự động nhận diện để xử lý các trường hợp khiếu nại của khách hàng ngay khi nhận cuộc gọi.

Qua cuộc thi, Viettel AI khẳng định quyết tâm tiên phong trong việc phát triển và ứng dụng các công nghệ xử lý tiếng nói tiên tiến nhất nhằm nâng cao chất lượng sản phẩm và dịch vụ. 

Quốc Tuấn