Tờ Bloomberg cho hay, ngày càng nhiều các chuyên gia AI tận dụng tầm ảnh hưởng lâu dài của bộ truyện đối với văn hoá đại chúng, cũng như dữ liệu ngôn ngữ phong phú và cách chơi chữ đa dạng trong truyện để thử nghiệm các công nghệ AI tạo sinh tiên tiến.

Chẳng hạn, thuật toán đang được xây dựng tính năng “quên” thông tin một cách có chọn lọc. Đây là một nhiệm vụ không dễ dàng với các mô hình ngôn ngữ lớn, vốn được đào tạo dựa trên lượng lớn dữ liệu trực tuyến gồm tài liệu có bản quyền hoặc không bản quyền.

a4daa58639780a8015e1c3cae886efa47e0472ef.jpg
Bộ truyện Harry Potter được sử dụng làm tài liệu văn học tham khảo do độ phổ biến và sự phong phú về ngôn ngữ tự nhiên trong truyện.

Các nhà nghiên cứu Mark Russinovich và Ronen Eldan từ Microsoft, cho biết họ đã chứng minh được rằng các mô hình AI có thể được thay đổi hoặc chỉnh sửa để loại bỏ bất kỳ kiến thức cụ thể nào, ví dụ như sự tồn tại của các cuốn truyện Harry Potter, gồm nhân vật và cốt truyện, mà không ảnh hưởng đến khả năng ra quyết định hay phân tích của cả hệ thống. Bộ đôi nghiên cứu nói rằng họ chọn Harry Potter vì tính phổ biến của tác phẩm.

“Ngay cả những người chưa đọc truyện cũng có thể biết đến những yếu tố có trong cốt truyện và nhân vật. Do đó, kỹ thuật của chúng tôi có thể được kiểm chứng để xác nhận rằng thuật toán có ‘biết’ đến bộ truyện này hay không”, Russinovich, Giám đốc công nghệ của Microsoft Azure nói.

Trong một nghiên cứu khác, các chuyên gia từ Đại học Washington, Đại học California và Viện AI Allen đã phát triển một mô hình ngôn ngữ mới có tên Silo, có thể loại bỏ dữ liệu để giảm rủi ro pháp lý. Tuy nhiên, hiệu suất của mô hình giảm đáng kể nếu chỉ được đào tạo trên văn bản có rủi ro thấp như sách không bản quyền hoặc văn bản chính phủ.

Với Harry Potter, “sự phong phú của các cảnh, lời thoại, khoảnh khắc cảm xúc khiến rất phù hợp với lĩnh vực xử lý ngôn ngữ tự nhiên cụ thể”, Leila Wehbe, nhà nghiên cứu của Carnegie Mellon, người từng thực hiện một loạt thí nghiệm vào năm 2014 thu thập dữ liệu MRI não từ những người đọc bộ truyện để tìm hiểu về cơ chế ngôn ngữ, cho hay.

Ngay cả khi không phải là trọng tâm của nghiên cứu, Harry Potter vẫn là tài liệu tham khảo văn học yêu thích của các nhà nghiên cứu. Chẳng hạn, nó được sử dụng để kiểm tra “trí thông minh” của thuật toán. Terrence Sejnowski, người đứng đầu phòng thí nghiệm sinh học thần kinh điện toán tại Viện nghiên cứu sinh học Salk, lập luận mô hình AI phản ánh sự thông minh và cả thành kiến của người dùng, giống như “chiếc gương ảo ảnh” trong truyện Harry Potter - luôn hiện ra mong muốn của người soi nó.

(Theo Bloomberg)