Lời toà soạn: ChatGPT tiếp tục là chủ đề được cộng đồng quan tâm trong những ngày qua. Báo VietNamNet xin giới thiệu bài viết của TS Nguyễn Hữu Huân – Trường Đại học Kinh tế TP.HCM - thành viên Nhóm nghiên cứu, phát triển chatbot Milu Việt Nam - để độc giả có thêm góc nhìn về chương trình máy tính sử dụng trí tuệ nhân tạo này.
Đừng "thần thánh" hóa ChatGPT
Chatbot trí tuệ nhân tạo, ChatGPT do OpenAI phát triển, đang thổi hồn vào cuộc sống, công việc của nhân loại thế giới. Mặc dù chatbot hay các robot trí tuệ nhân tạo không mới, đã được nhiều công ty công nghệ lớn nghiên cứu, phát triển từ lâu, nhưng ChatGPT mang hơi hướng khác khi trò truyện như một con người, có bộ óc có thể trả lời được hầu như tất cả câu hỏi về mọi lĩnh vực (dù tỷ lệ sai số còn ở mức cao).
Dẫu vậy, ưu điểm vượt trội của ChatGPT là trả lời nhanh, trò truyện tự nhiên. Nó giống như một trợ lý ảo hỗ trợ soạn thảo văn bản, tìm kiếm, phân tích thông tin, sáng tạo các ý tưởng mới, thậm chí là soạn nhạc, làm thơ…
Chatbot này là tập hợp của một loạt thuật toán phức tạp về lập trình ngôn ngữ tư duy NLP (Natural language processing) và các cấu trúc của những mô hình trí tuệ nhân tạo như Neural Network (mạng nơ ron nhân tạo); Reinforcement learning (học tăng cường) hay thuật toán biến đổi. Nhờ sự kết hợp trên, ChatGPT có thể tư duy, trò chuyện như người thực thụ với kho kiến thức như vô hạn. Chatbot có thể tự học dựa trên bộ dữ liệu có sẵn hoặc trên mạng mà không cần phải được huấn luyện như chatbot của các thuật toán cũ.
Nhờ vào khả năng tự học (unsupervised learning), ChatGPT sẽ càng ngày càng thông minh, hoàn thiện hơn khi bộ dữ liệu tăng dần thông qua việc càng có nhiều người dùng tương tác. Tuy nhiên, nhiều dữ liệu chưa phải là tốt, nhiều dữ liệu đúng mới là tốt. Hiện, người dùng ChatGPT thường đưa ra các thông tin sai lệch, nhằm thử trí thông minh của nó, khiến ChatGPT nhầm lẫn, điều này cũng có thể tạo sự sai lệch thông tin. OpenAI đương nhiên sẽ phải sử dụng bộ lọc, kiểm tra lại dữ liệu trước khi hệ thống hóa thành các thông tin đúng để ChatGPT học.
Ở một góc nhìn khác, chúng ta cũng không nên "thần thánh" hóa ChatGPT vì tỷ lệ trả lời sai hiện nay là khá cao. Hạn chế của mô hình học máy hiện tại là tổng hợp lượng thông tin khổng lồ, sau đó, khi người dùng đặt câu hỏi, ChatGPT sẽ tổng hợp các nội dung có liên quan trong khi dữ liệu của nó, cho ra kết quả trả lời theo ngôn ngữ tự nhiên.
Trong trường hợp, câu hỏi không phổ biến được đưa ra hoặc kho dữ liệu chưa có thì ChatGPT sẽ trả ra kết quả gần giống. Đương nhiên, một nửa sự thật không phải là sự thật. Ví dụ điển hình, khi hỏi ChatGPT, Quang Trung và Nguyễn Huệ là ai ? Chatbot này nhầm lẫn khá nhiều khi cho Quang Trung là Nguyễn Nhạc hay Quang Trung là người giành chiến thắng trong cuộc chiến với chính đội quân Tây Sơn của mình…
Chính nhà sáng lập ChatGPT cũng từng thừa nhận, đa số các câu trả lời của nó là sai.
Sự đánh đổi trong trí tuệ nhân tạo
Trong 2 năm qua, nhóm nghiên cứu của chúng tôi cũng đã phát triển chatbot Milu dựa trên nền tảng của GPT3.5 của OpenAI; BlenderBot của Facebook; Google LaMDA. Thực tế chứng minh, việc tiếp cận với những thuật toán mới quá khó, nhiều rào cản. Đối với phần cứng, để chạy được các model về AI (trí tuệ nhân tạo) thì hệ thống có chi phí rất tốn kém. Thử hình dung, để một bộ não thông minh và xử lý tốt thông tin thì ngoài việc cấu trúc bộ não (thuật toán), chúng ta phải có một cơ sở hạ tầng rất mạnh cho nó, để có một siêu AI với các model phức tạp thì cần một siêu máy tính tương ứng. Nguồn lực đầu tư có hạn nên thay vào đó, chúng tôi cố gắng cấu trúc thuật toán thật tối ưu để tiết kiệm được tài nguyên càng nhiều càng tốt.
Milu không kém cạnh so với ChatGPT về khả năng và tốc độ xử lý, người dùng không cần phải dùng VPN hay mạng ảo, số điện thoại nước ngoài để đăng ký vì đây là ứng dụng của Việt Nam. Dẫu vậy, chatbot nội vẫn đang phải đứng trên vai những “người khổng lồ công nghệ” về mặt dữ liệu.
Từ kinh nghiệm thực tế của nhóm nghiên cứu, chúng tôi thấy, ChatGPT đang làm rất tốt, nhưng để đưa ra sự phân tích thông tin chính xác thì ChatGPT còn lâu mới đạt được khả năng như Google. Lưu ý, nếu trở thành một chatbot rập khuôn theo dạng cỗ máy tìm kiếm Google thì thông tin sẽ chính xác, nhưng mất đi sự sáng tạo.
Các nhà phát triển AI phải đánh đổi giữa tính chính xác và sự sáng tạo trong một chatbot. Điều này cũng giống như con người với não trái đại diện cho sự chính xác, logic và não phải đại diện cho sáng tạo, tư duy. Phần não nào mạnh thì con người sẽ thiên về hướng đó hơn, phần còn lại sẽ yếu hơn.
Để tạo ra một chatbot vẹn toàn cả hai, hiện nay, các nhà nghiên cứu đang đưa ra nhiều giải pháp như mô hình AI check AI, tức sau khi AI trả lời thì có một AI khác mạnh về logic sẽ check lại thông tin có chính xác không, từ đó, đưa ra câu trả lời cuối cùng. Một giải pháp khác là việc giảm phạm vi gần đúng của AI, cách này sẽ hạn chế sự sáng tạo, như vậy, câu trả lời thường sẽ là “Tôi không biết” khi chatbot không tìm được thông tin.
Ngoài ra, một cách khác là kết hợp chatbot với cơ sở dữ liệu tri thức bên ngoài để đảm bảo thông tin trả lời được chính xác. Tuy nhiên, việc xây dựng một cơ sở dữ liệu uy tín, đồ sộ như vậy rất tốn thời gian, tiền bạc. Để xây dựng ChatGPT, các nhà đầu tư đã rót hàng tỷ USD cho quá trình nghiên cứu, phát triển, nếu xây dựng thêm một cơ sở dữ liệu chính xác, chi tiết cho AI dễ hiểu và cập nhật thông tin, số tiền hay thời gian bỏ thêm còn tốn gấp nhiều lần nữa.
Do vậy, nếu ChatGPT sẽ trở thành siêu AI trong tương lai thì cần có bộ sơ sở siêu dữ liệu như trên hoặc thuật toán sẽ mang yếu tố quyết định. Phải giải được bài toán đánh đổi giữa sự chính xác và sự sáng tạo, hình thành một siêu trí tuệ có thể trả lời, hoàn thành được mọi yêu cầu đưa ra của con người. Với cuộc đua này, Google, Facebook cũng như các tập đoàn công nghệ lớn chắc chắn không đứng ngoài cuộc. OpenAI có lợi thế là người đi đầu, nhưng ai là nhà vua thì phải chờ thời gian trả lời.
Tiến sỹ Nguyễn Hữu Huân – Trường Đại học Kinh tế TP.HCM
Báo VietNamNet trân trọng cảm ơn và mời độc giả tiếp tục tham gia viết bài chia sẻ về ChatGPT. Các bài viết vui lòng gửi về địa chỉ: banictnews@vietnamnet.vn.