Chia sẻ trên được Giáo sư Vũ Hà Văn, Giám đốc Khoa học của VinBigdata đưa ra tại buổi trao đổi với phóng viên bên lề sự kiện ra mắt ViGPT vừa qua.
ViGPT cần sự đóng góp từ người làm kỹ thuật và cộng đồng
Giáo sư Vũ Hà Văn cho biết, với các hãng lớn như Google, việc phát triển ngôn ngữ lớn họ sẽ chọn tiếng Anh hay tiếng Pháp là chính, mặc dù có cả ngôn ngữ tiếng Việt nhưng kết quả tìm kiếm hay tra cứu sẽ tương đối chậm so với các ngôn ngữ khác. Đến một mức độ nào đó, các câu trả lời của các mô hình ngôn ngữ lớn này cho các câu hỏi từ tiếng Việt sẽ không đầy đủ và chính xác.
Vì thế, ở đây VinBigdata hi vọng rằng, theo thời gian ViGPT sẽ vượt lên họ ở mức độ chính xác về những câu hỏi liên quan trực tiếp đến văn hoá, lịch sử, địa lý… những thông tin mang đặc trưng và tính chất của riêng người Việt. Đây là điều mà những người làm nên mô hình ngôn ngữ lớn tiếng Việt mong muốn và mục tiêu trong tương lai khi hỏi những vấn đề của người Việt, đây sẽ là nguồn đối chiếu tốt hơn so với của nước ngoài.
Đi sâu hơn, vị Giám đốc Khoa học của VinBigdata phân tích, chẳng hạn một câu hỏi trong một giai đoạn chính trị “nhạy cảm” về lịch sử của Trường Sa và Hoàng Sa, chúng ta rất khó có thể bảo đảm câu trả lời từ Google hay OpenAI nó không mang xu hướng chính trị của những người thành lập hay đứng sau các công ty này. Ở đây chúng ta có những sự lựa chọn khác ở Việt Nam, sẽ tốt hơn nếu chúng ta nghĩ về vấn đề đó.
“Mục đích của chúng ta khi xây dựng mô hình ngôn ngữ lớn cho người Việt là đem lại câu trả lời tốt nhất cho người Việt, mục đích của họ chúng ta không thể biết được”, Giáo sư Vũ Hà Văn chia sẻ.
Thừa nhận rằng có rất nhiều thứ ViGPT hiện nay không thể bằng ChatGPT hay Google Bard được, vì tỉ lệ đầu tư của các doanh nghiệp này và thời gian họ thực hiện hơn đến cả ngàn lần. Nhưng giáo sư Vũ Hà Văn cho biết, ở một số câu hỏi thiên về Việt Nam như “Lá cờ thêu sáu chữ vàng của ai?”, ViGPT sẽ trả lời là của Trần Quốc Toản, trong khi đó các phiên bản kia có thể sẽ bị sai. Trong tương lai, với những câu hỏi sâu như thế này, ViGPT sẽ làm tốt hơn nếu như có sự phản hồi của người dùng trong nước.
“Nếu người dùng chỉ có chê thôi, hoặc cho rằng mô hình ngôn ngữ lớn này vẫn còn ngu lắm khi những câu hỏi con tôi 10 tuổi cũng biết mà nó không biết, hoặc hỏi những câu hỏi mẹo nhằm chứng minh chúng ta khôn hơn AI. Chúng ta khôn hơn AI thật đó, nhưng nó không vì mục đích gì cả, ở đây chúng ta không làm cho sản phẩm tốt hơn mà làm cho những người làm ra sản phẩm buồn hơn. Chính vì thế, VinBigdata cần sự đóng góp chung của những người làm kỹ thuật và cộng đồng, chúng tôi cần sự đồng hành của người Việt trong việc hoàn thiện sản phẩm để nó không chỉ là đơn thuần là công cụ phục vụ, mà còn là niềm tự hào của người Việt”, Giáo sư Vũ Hà Văn nhấn mạnh.
Sẵn sàng ủng hộ và đồng hành cùng mô hình ngôn ngữ lớn tiếng Việt
Trao đổi với VietNamNet, đại diện các startup đang làm về AI tại Việt Nam cho biết, họ sẵn sàng ủng hộ và đồng hành cùng mô hình ngôn ngữ lớn tiếng Việt của VinBigdata.
Ông Đinh Trần Tuấn Linh, Giám đốc công nghệ công ty cổ phần Unikon, đơn vị sở hữu nền tảng Aicontent.vn cho biết, hiện không có nhiều quốc gia ở châu Á nỗ lực huấn luyện thành công mô hình ngôn ngữ lớn của riêng mình, đi đầu có thể kể đến Trung Quốc, Hàn Quốc, Nhật Bản... Chính vì thế ViGPT là một tín hiệu quan trọng cho nỗ lực đầu tư công nghệ lõi của người Việt. Theo ông Đinh Trần Tuấn Linh, hành trình vạn dặm nào cũng cần phải bắt đầu từ những bước chân đầu tiên, là một đơn vị tiên phong ứng dụng AI, Unikon sẵn lòng tham gia đóng góp, kiểm thử, phản hồi và thậm chí sử dụng thử nghiệm ViGPT trong một số dự án quy mô phù hợp.
Trong khi đó, ông Đặng Hữu Sơn, Đồng sáng lập Lovinbot cho rằng, việc VinBigdata lắng nghe cộng đồng và các chuyên gia góp ý là một điều rất đáng mừng để phát triển mô hình ngôn ngữ lớn riêng cho người Việt. Là một người làm kỹ thuật, ông Đặng Hữu Sơn cũng đã có các phản hồi đến đội ngũ kỹ thuật của VinBigdata sau khi sử dụng sản phẩm.
Theo ông Đặng Hữu Sơn, với một sản phẩm mới ra mắt không thể hoàn thiện ngay được, tuy nhiên cũng không thể nhận được sự ủng hộ hoàn toàn của cộng đồng ngay được, bởi tâm lý người Việt lâu nay không nghĩ Việt Nam có thể làm được công nghệ đó, nên vẫn cần có thời gian. Đồng thời, VinBigdata cần có các hướng dẫn cụ thể cách để cộng đồng cùng hỗ trợ và đồng hành sẽ tốt hơn.
Ông Đặng Hải Lộc sáng lập nền tảng Mindmaid, cũng chia sẻ, hiện có rất ít quốc gia trên thế giới xây dựng được mô hình ngôn ngữ lớn tiếng bản địa. Ngay cả những nước giàu có và có nền công nghệ thông tin mạnh như Ấn Độ, hay các nước GPD cao hơn Việt Nam như Indonesia, Trung Đông…không phải cứ muốn là làm được, vì nó còn phụ thuộc vào đặc điểm ngôn ngữ. Vì vậy nên xuất phát từ quan điểm nhìn rộng ra là Việt Nam có lợi thế chiến lược việc xây dựng mô hình ngôn ngữ lớn tiếng bản địa, và đây sẽ là một lợi thế chiến lược để người Việt cạnh tranh toàn cầu.
Theo ông Đặng Hải Lộc, nỗ lực xây dựng mô hình ngôn ngữ lớn tiếng Việt nào cũng đáng quý, và cần được góp ý theo hướng đóng góp cụ thể để mô hình trở nên hoàn thiện hơn từng ngày, thay vì vin vào một số nhược điểm của hiện tại để phủ nhận toàn bộ nỗ lực của các đơn vị công nghệ trong nước. Người Việt cũng nên phổ biến rộng rãi hơn về tầm quan trọng của công nghệ ngôn ngữ lớn trong kỉ nguyên AI và thảo luận nhiều hơn về việc ứng dụng nó như thế nào để tạo ra giá trị nâng tầm cho mình, cho doanh nghiệp Việt, thay vì đi so sánh mô hình ngôn ngữ lớn tiếng Việt với các mô hình ngôn ngữ lớn tốt nhất của thế giới hiện nay. Vì ngôn ngữ lớn là công nghệ đa dụng (general AI), có thể không tốt ở một bài toán này, nhưng lại phù hợp ở bài toán cụ thể khác. Đặc biệt mô hình ngôn ngữ lớn tiếng Việt sẽ có lợi thế tốt hơn trong các bài toán liên quan tới việc hiểu và sinh tiếng Việt.