Ngày 17/12, ByteDance làm rõ bài báo của The Verge cáo buộc công ty bí mật sử dụng công nghệ của OpenAI để phát triển mô hình ngôn ngữ lớn (LLM) riêng, trong khi che giấu hành vi bằng kỹ thuật “khử nhạy dữ liệu”.

Trong tuyên bố gửi SCMP, ByteDance thừa nhận khi bắt đầu khám phá các mô hình LLM hồi đầu năm, một nhóm nhỏ kỹ sư của hãng đã sử dụng dịch vụ API của OpenAI trong mô hình thử nghiệm nhưng không đồng nghĩa với việc phát hành ra công chúng.

Ngoài ra, công trình bị dừng vào tháng 4 sau khi OpenAI cấm dùng đầu ra từ các sản phẩm GPT để “phát triển mô hình cạnh tranh với OpenAI”.

kpbvqfgo.png
Văn phòng ByteDance tại Thượng Hải, Trung Quốc (Ảnh: Reuters)

Nhóm kỹ sư của ByteDance vẫn sử dụng API của OpenAI song song với các mô hình bên thứ ba khác “ở mức độ vô cùng hạn chế trong quy trình đánh giá/thử nghiệm như chấm điểm hiệu chuẩn”, công ty mẹ TikTok cho hay. “ByteDance được cấp phép để sử dụng API của OpenAI và chú trọng vào việc tuân thủ các điều khoản sử dụng của OpenAI”.

Dù vậy, OpenAI cho biết đã tạm dừng quyền truy cập dịch vụ của ByteDance để điều tra thêm. “Nếu phát hiện việc sử dụng không tuân thủ chính sách, chúng tôi sẽ yêu cầu họ thực hiện thay đổi cần thiết hoặc hủy bỏ tài khoản của họ”.

OpenAI vẫn chưa chính thức ra mắt dịch vụ tại Trung Quốc.

Bài báo tố cáo ByteDance lợi dụng công nghệ của OpenAI để xây dựng mô hình riêng xuất hiện sau khi doanh nghiệp AI 01.AI của chuyên gia Lee Kai Fu bị tố sao chép kiến trúc mô hình LLM Llama của Meta trong mô hình LLM Yi-34B.

Cáo buộc làm dấy lên tranh luận trong cộng đồng AI và một số người đặt nghi vấn về tính ngay thẳng của các startup AI Trung Quốc.

Từ khi OpenAI giới thiệu ChatGPT dựa trên mô hình GPT 3.5 vào tháng 11/2022, các hãng công nghệ Trung Quốc cũng chạy đua để bắt kịp làn sóng AI tạo sinh, ra mắt các sản phẩm cạnh tranh.

Tuy nhiên, sự ra đời của GPT-4 Turbo hồi đầu tháng 11 được dự đoán sẽ nới rộng khoảng cách giữa OpenAI với các đối thủ Trung Quốc.

Trong khi đó, Trung Quốc ghi nhận tăng trưởng bùng nổ về số lượng LLM trong nước. Cho đến tháng 7, ít nhất 130 LLM đã được các doanh nghiệp và tổ chức nghiên cứu nội địa phát hành, khiến nhiều nhân vật có tiếng tăm như nhà sáng lập kiêm CEO Baidu Robin Li phải lên tiếng quan ngại. Ông cho rằng Trung Quốc có quá nhiều mô hình AI nền tảng, lãng phí tài nguyên khổng lồ.

(Theo SCMP)