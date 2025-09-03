Theo kết quả sơ bộ từ ban tổ chức, Hunyuan-MT-7B đứng đầu ở 30 trên tổng số 31 bài kiểm tra, vượt qua cả những hệ thống nổi tiếng của Google và OpenAI.

WMT25 là sự kiện thường niên quy tụ các nhà nghiên cứu và phát triển dịch máy trên toàn cầu, được xem như “sân chơi đỉnh cao” để đánh giá năng lực công nghệ dịch thuật.

Website của mô hình Hunyuan. Ảnh: Shutterstock

Điều khiến giới công nghệ chú ý là quy mô “nhỏ nhưng có võ”, chỉ có 7 tỷ pham số của Hunyuan-MT-7B.

Thay vì chạy theo xu hướng phóng to số lượng tham số, Tencent lại tập trung vào việc xây dựng một “quy trình huấn luyện toàn diện”, bao gồm chọn lọc dữ liệu, huấn luyện liên tục, tinh chỉnh nhiều lớp và học tăng cường.

Nhờ vậy, mô hình này vẫn tạo ra kết quả mượt mà, chính xác và thậm chí vượt trội hơn những đối thủ có quy mô lớn gấp nhiều lần.

"Điểm mạnh của Hunyuan-MT-7B chính là tận dụng ít tham số để đạt chất lượng ngang bằng, thậm chí tốt hơn các mô hình khổng lồ”, nhóm phát triển chia sẻ.

Các ngôn ngữ được đưa vào thử nghiệm rất đa dạng, từ Ả Rập, Estonia cho đến Maasai - thứ tiếng của khoảng 1,5 triệu người ở Kenya và Tanzania.

Ngoài ra còn có cặp ngôn ngữ Czech - Ukrainian, tiếng Nhật - Trung giản thể. Chỉ duy nhất với tiếng Bhojpuri – ngôn ngữ được hơn 50 triệu người tại Ấn Độ và Nepal sử dụng, Hunyuan-MT-7B không đạt vị trí cao nhất.

Tuy nhiên, ban tổ chức cũng nhấn mạnh đây mới chỉ là kết quả sơ bộ, dựa trên đánh giá tự động.

“Những con số này cần được nhìn nhận một cách thận trọng, vì có thể vẫn tồn tại thiên lệch trong quá trình chấm điểm”, ông Tom Kocmi, nhà nghiên cứu của công ty Cohere và đồng thời là trưởng ban tổ chức WMT25, cho biết.

Kết quả chính thức dựa trên đánh giá thủ công từ con người sẽ được công bố tại hội nghị diễn ra từ ngày 5 đến 9/11 tại thành phố Tô Châu (Trung Quốc).

Không chỉ dừng lại ở phòng thí nghiệm, Tencent đã đưa mô hình này vào các sản phẩm thực tế như nền tảng họp trực tuyến Tencent Meeting, trình duyệt web và bản doanh nghiệp của ứng dụng WeChat.

Đồng thời, Hunyuan-MT-7B cũng đã được chia sẻ trên Hugging Face và GitHub để cộng đồng phát triển AI có thể khai thác.

Sự kiện này một lần nữa cho thấy cuộc đua dịch máy bằng AI đang nóng lên từng ngày và “ngựa ô” Hunyuan-MT-7B của Tencent đã chứng minh rằng không phải mô hình lớn mới là kẻ mạnh.

(Theo aitechsuite)