Trong thời đại hiện nay, dữ liệu giống như một loại dầu mỏ mới. Các hoạt động online mang lại nguồn tài nguyên vô tận cho các gã khổng lồ công nghệ. Chúng ta vẫn nghĩ mình nắm quyền chủ động trong việc lướt mạng, click vào một đường link, thả tim, like… nhưng thực ra không phải như vậy.
Khi thu thập được dữ liệu người dùng, các công ty công nghệ hoàn toàn vẽ được chân dung chi tiết của mỗi cá nhân, về việc họ thích nghe gì, xem gì, có cảm xúc như thế nào khi đọc từng loại tin tức, từ đó gợi ý những nội dung tương ứng.
Điều này đúng với cả các nền tảng mạng xã hội phổ biến như Facebook, Instagram hay TikTok, YouTube. Đằng sau những bài đăng gợi ý của nền tảng, đó là các thuật toán với cơ chế nhằm “thao túng” cảm xúc và hành vi của người dùng.
Chia sẻ tại một buổi hội thảo về các thuật toán được tổ chức mới đây, ông Đặng Văn Quân, kỹ sư về học máy cho biết, các mạng xã hội đang trói buộc người dùng thông qua việc phân phối nội dung tới đúng người, đúng thời điểm, đúng đối tượng. Đó là những nội dung mà người dùng có nhiều khả năng quan tâm và tương tác.
Sở dĩ các mạng xã hội biết nội dung nào cần gợi ý cho ai, bởi họ dựa trên những thông tin cá nhân về nhân khẩu học, giới tính, chủng tộc, tuổi tác, ngôn ngữ và vị trí địa lý. Các mạng xã hội cũng sử dụng những thông tin về sở thích, hành vi của người dùng để phân phối nội dung cho họ.
“Các bài đăng, lượt thích, xem, chia sẻ bình luận, thời gian tương tác… của người dùng trên mạng xã hội sẽ được sử dụng như một loại dữ liệu nhằm giúp các nền tảng này phân phối nội dung tới đúng người dùng”, kỹ sư học máy Đặng Văn Quân nói.
Ở vai trò đồng sáng lập cộng đồng MLOpsVN - một diễn đàn về các hệ thống học máy, ông Quân cho rằng, về mặt kỹ thuật, Facebook sẽ thu thập thông tin từ các hoạt động đăng tải bài viết và những thói quen, sở thích được thiết lập sẵn, sau đó kết hợp chúng lại để hình thành nên sự hiểu biết về người dùng. Từ những tri thức này, hệ thống AI của Facebook sẽ học và hiểu người dùng cả trong ngắn và dài hạn, để rồi phân phối nội dung theo mức độ quan tâm và sở thích của họ.
Theo anh Trần Hữu Nhân, kỹ sư về khoa học dữ liệu và học máy, ở ngoài đời thực, mỗi nhân viên bán hàng là một hệ thống gợi ý thông tin “chạy bằng cơm”. Trong thời đại CNTT, các nền tảng sẽ sử dụng một loại thuật toán để thay thế vai trò đó.
Nếu một người bán hàng gợi ý việc mua sắm thông qua hình ảnh bề ngoài, quần áo, cách ăn mặc của khách thì thuật toán lại dựa trên nhiều thông tin khác. Chúng làm việc thông qua các hoạt động của người dùng trên mạng xã hội. Các nền tảng có thể dựa vào đó để hiểu kỹ hơn về người dùng.
“Vậy ai là người sở hữu, kiểm soát những dữ liệu đó?”, anh Nhân đặt vấn đề. Theo kỹ sư trẻ này, mặt tối của AI và công nghệ không phải là thuật toán mà là lợi ích của những người đứng đằng sau đó. Khi dùng mạng xã hội, chúng ta đã vô tình trao vào tay họ những dữ liệu cá nhân của mình.
Theo các chuyên gia, càng ngày các hệ thống điện tử càng hiện đại, nếu chúng ta không thông minh hơn những thứ mà mình đang sử dụng thì đó sẽ là con dao 2 lưỡi. Để giải quyết câu chuyện đó, người dùng cần nhận thức được về tầm quan trọng của vấn đề dữ liệu, các quyền kiểm soát dữ liệu của bản thân, và phải làm sao để bảo vệ những dữ liệu cá nhân của mình.