Nhiều người dùng có thể ngạc nhiên khi họ vừa đăng tải một bức ảnh, Facebook ngay lập tức đề xuất những bạn bè họ có thể muốn gắn thẻ (tag). Tất cả bí mật nằm ở chỗ, những thuật toán học hỏi sâu của Facebook được thiết kế để khiến mọi thứ với người dùng trở nên dễ dàng hơn.

{keywords}

Điều không mấy ai biết là công nghệ nói trên của Facebook cũng bổ sung các tag của nó vào ảnh của người dùng, phân tích số lượng người xuất hiện trong ảnh, bối cảnh và thậm chí việc họ có mỉm cười hay không.

Hiện, một nhà phát triển vừa trình làng một tiện ích mở rộng mới cho trình duyệt Chrome, hé lộ cho người dùng biết Facebook "nhìn thấy" những gì trong các bức ảnh được đăng tải lên trang mạng xã hội này. Công cụ có tên gọi là "Show Facebook Computer Vision Tags", do kỹ sư phần mềm Adam Geitgey phát triển.

Theo ông Geitgey, Facebook sử dụng trí thông minh nhân tạo (AI) và công nghệ nhận diện hình ảnh để phát hiện những gì xuất hiện trong các bức ảnh được đăng tải. Tính năng này gọi là "Automatic Alternative Text". Công cụ hoạt động trên khắp các ứng dụng của Facebook và dựa vào một "hệ thống máy tính mô phỏng não người" có tên Deep ConvNet được dạy cách nhận diện các mục tiêu trong ảnh thông qua hàng triệu ví dụ.

Danh sách các mục tiêu có thể xuất hiện trong ảnh mà hệ thống AI của Facebook cần nhiện diện rất rộng, từ diện mạo của con người (trẻ em, kính, râu, đồ trang sức, ...), thiên nhiên (phong cảnh ngoài nhà, núi non, tuyết, bầu trời,...) tới phương tiện giao thông (xe hơi, tàu thuyền, máy bay, xe đạp, ...), thể thao (môn quần vợt, bơi, sân vận động, bóng đá, ...) và thức ăn (kem, bánh pizza, cà phê, ...). Bối cảnh cũng cung cấp các thông tin khác về bức ảnh, kể cả con người (số lượng người, hành động mỉm cười, trẻ em, ...), các vật thể (xe, tòa nhà, cây, đám mây, đồ ăn, ...), khung cảnh (bên trong nhà hàng, ngoài tự nhiên, trong nhà, ...) và các đặc điểm khác của hình ảnh (ký tự, ảnh tự sướng).

Bản thân Facebook từng tuyên bố, công ty luôn đảm bảo các thuật toán nhận diện của mình có thể phát hiện được bất kỳ mục tiêu nào trong số trên với độ chính xác tối thiểu là 0,8, một số cao tới 0,99.

Do Deep ConvNet của Facebook mới chỉ đi vào vận hành vài tháng, nên tạp chí New York dự đoán hệ thống AI này sẽ bắt đầu học hỏi nhiều hơn về các bức ảnh. Tiện ích mở rộng của ông Geitey cũng dự kiến cho thấy nhiều tag hơn, thay vì 3 - 4 mục như hiện nay.

"Khi Facebook trình làng công cụ này vào tháng 4, họ có thể phát hiện 100 từ khóa. Nhưng loại hệ thống này luôn phát triển khi họ thu nhận nhiều dữ liệu hơn. Trong 1 - 2 năm tới, họ có thể phát hiện hàng ngàn thứ khác nhau. Thử nghiệm của tôi với công cụ này cho thấy họ hiện đã nhận diện được hơn 100 từ khóa", ông Geitey cho biết thêm.

Facebook không chỉ theo dõi các bức ảnh của người dùng, mà còn âm thầm giám sát việc họ đang làm gì trong khi truy cập mạng xã hội để khiến họ trở thành mục tiêu "dội bom" của các quảng cáo nhất định. Quá trình này được thực hiện dựa vào 98 đầu mục dữ liệu cá nhân Facebook thu thập được về người dùng. 

Tuấn Anh (theo Daily Mail)