Nhà phát triển các ứng dụng luôn nói rằng dữ liệu cá nhân của người dùng sẽ được bảo vệ tối đa nhưng trên thực tế không phải như vậy.
Khi điện thoại của chúng ta lại chính là gián điệp
Trong cơ sở dữ liệu của nhiều nhà phát triển ứng dụng, có sự xuất hiện của những dấu chấm. Chúng xuất hiện tại nhiều địa điểm khác nhau, tương ứng với quãng đường di chuyển của người dùng. Mỗi một dấu chấm hiện lên bản đồ là một lần ứng dụng cài trên smartphone gửi thông tin về vị trí của bạn cho máy chủ.
Ngày làm việc của Lisa Margin - một giáo viên dạy toán 46 tuổi người Mỹ bắt đầu từ 7 giờ sáng. Cô phải di chuyển quãng đường khoảng 22,5 km để đi từ nhà đến lớp học. Như thường lệ, chiếc điện thoại thông minh là món đồ không thể thiếu với cô giáo này.
Thế nhưng Lisa không biết rằng, một ứng dụng trên chiếc di động đã âm thầm ghi lại thông tin về vị trí của cô. Cứ mỗi 2 giây, nó lại gửi thông tin này về máy chủ để người ta có thể bán chúng.
Lisa chỉ là một trong số hàng triệu trường hợp người dùng tại New York nằm trong tập hồ sơ lộ lọt dữ liệu của The Times. Mặc dù thông tin về vị trí cụ thể của Lisa Margin không được hé lộ, thế nhưng người ta có thể dễ dàng kết nối tới dữ liệu của cô và hiển thị chúng dưới dạng những dấu chấm trên bản đồ.
Với dữ liệu trong khoảng thời gian 4 tháng được xem xét, thông tin vị trí của Lisa được ứng dụng ngầm gửi về máy chủ tới 8.600 lần. Tính trung bình, hệ thống sẽ nhận được dữ liệu vị trí của Lisa cứ sau mỗi 21 phút, trong đó bao gồm cả nhiều dữ liệu về các địa điểm nhạy cảm. |
Những dữ liệu này bao gồm cả các thông tin nhạy cảm như việc Lisa tìm đến với các dịch vụ giảm cân và bác sĩ da liễu. Lịch hoạt động của Lisa cũng như địa chỉ nhà bạn trai cũ của cô tất nhiên cũng sẽ có trên kho cơ sở dữ liệu. Đó đều là những thông tin thuộc dạng đời tư cá nhân mà chẳng ai trong chúng ta chấp nhận để một người lạ biết và kiểm soát nó.
Giống như nhiều người dùng khác, Lisa nhận thức được việc các ứng dụng đang ngấm ngầm theo dõi hoạt động của mình. Tuy nhiên, với sự phổ biến của điện thoại thông minh, cô đành chọn phương án thỏa hiệp với việc đời tư cá nhân của mình bị xâm phạm.
Theo The Times, có ít nhất 75 công ty nhận được dữ liệu về vị trí chính xác của người dùng thông qua các ứng dụng. Những dữ liệu này được thu thập khi người dùng kích hoạt tính năng định vị để nhận thông tin tức thời từ ứng dụng. Đó có thể là thông tin về thời tiết tại địa phương hoặc các ứng dụng có tính năng gợi ý về quãng đường di chuyển.
Một số doanh nghiệp còn mạnh miệng khi tuyên bố, họ đang nắm quyền theo dõi dữ liệu của khoảng 200 triệu thiết bị di động tại Hoa Kỳ. Dữ liệu của The Times cho thấy, thông tin vị trí mà các dữ liệu cung cấp có độ sai lệch chỉ vài mét, và rằng có một số ứng dụng cập nhật thường xuyên với tần suất lên tới 14.000 lần mỗi ngày.
Thông tin về thói quen di chuyển của thị trưởng thành phố New York cũng nằm trong kho dữ liệu được các ứng dụng âm thầm thu thập. |
Những dữ liệu thu thập được sau đó sẽ được bán hoặc sử dụng để phân tích dữ liệu cho các công ty quảng cáo, các doanh nghiệp bán lẻ và bất kỳ đơn vị nào muốn có trong tay dữ liệu chi tiết về thói quen của người dùng. Đây là một thị trường lớn khủng khiếp với quy mô vào năm nay lên tới 21 tỷ USD.
IBM - người khổng lồ công nghệ của nước Mỹ thậm chí cũng can dự vào lĩnh vực kinh doanh này với việc mua lại Weather Channel - một ứng dụng chia sẻ thông tin thời tiết khá phổ biến. Không chỉ có IBM, các nhà đầu tư nổi tiếng trong lĩnh vực khởi nghiệp như Goldman Sachs và nhà đồng sáng lập Paypal - Peter Thiel cũng không thể đứng ngoài khi nhìn thấy món lợi đó.
Theo The Times, điều mà các ông lớn quan tâm là độ lớn của mẫu thay vì dữ liệu cá nhân của từng người dùng. Những dữ liệu mà các công ty này nắm giữ được thể hiện thông qua số ID thay vì có danh tính cụ thể. Tuy nhiên, vẫn có một số người có quyền tiếp cận với các dữ liệu gốc mặc cho người sử dụng có muốn hay không. Đây chính là rủi ro lớn nhất đối với quyền riêng tư của người dùng.
Khi truy cập vào dữ liệu gốc, những kẻ có ý đồ xấu có thể dễ dàng theo dõi một ai đó bằng cách nắm lịch di chuyển vị trí của chiếc điện thoại. Ở chiều ngược lại, cho dù thuê bao có ẩn danh, kẻ xấu cũng dễ dàng tra ngược để tìm ra chủ thuê bao từ vị trí căn nhà mà chiếc điện thoại này “dừng chân” mỗi đêm.
Trước những cáo buộc này, không ít nhà phát triển bao biện bằng cách nói rằng người dùng đã cấp quyền chia sẻ vị trí cho ứng dụng của họ. Tuy vậy, điều đó chỉ hợp pháp khi những công ty này không bán hay chia sẻ lại dữ liệu người dùng.
Dữ liệu cá nhân, quan trọng là cách chia sẻ
Tại một hội thảo được tổ chức vào năm ngoái, Elina Greenstein - giám đốc công ty dữ liệu địa điểm GroundTruth từng vạch ra con đường từ nhà đến văn phòng làm việc của một người dùng. Mục tiêu của Elina Greenstein là cho người nghe thấy tiềm năng khám phá sở thích cá nhân của một người khi theo dõi hoạt động của người đó.
“Chúng tôi sẽ tìm ra một người là ai dựa trên nơi họ đã đến và nơi họ sẽ đến, từ đó tìm cách gây ảnh hưởng đến việc họ sẽ làm gì tiếp theo”, bà Elina Greenstein nói.
Số lượng người đến làm việc và mua hàng phản ánh tình hình kinh doanh của một nhà máy hoặc cửa hàng có tốt hay không. Các công ty tài chính có thể dựa vào những dữ liệu này để đưa ra quyết định đầu tư trước cả khi báo cáo của doanh nghiệp được công bố.
Việc cấp quyền sử dụng dữ liệu vị trí đem tới nhiều rủi ro đối với người dùng di động. |
Dữ liệu năm 2018 của MightySignal cho thấy, có khoảng 1.200 ứng dụng chứa mã chia sẻ vị trí trên Android. Trong khi đó ở iOS, con số này là khoảng 200 ứng dụng.
Theo Reveal Mobile, công ty sở hữu tới 500 ứng dụng tích hợp mã chia sẻ vị trí, sự phổ biến của các đoạn mã này giúp các nhà phát triển ứng dụng có thể kiếm được tiền từ quảng cáo. Trong khi đó, người dùng cũng hưởng lợi khi được sử dụng miễn phí các ứng dụng.
Với ứng dụng thể thao TheScore, khi chia sẻ thông tin vị trí cá nhân, người dùng có thể nhận về kết quả các trận đấu của những đội bóng địa phương gần như ngay tức khắc. Còn với Weather Channel - ứng dụng thời tiết vừa được mua lại bởi IBM, việc chia sẻ vị trí giúp người dùng cập nhật tự động thông tin thời tiết tại địa điểm mà họ đang đứng, thay vì tình hình thời tiết chung chung của cả một thành phố. Điều này cho thấy, tính hai mặt của câu chuyện chia sẻ dữ liệu.
Serge Egel - nhà nghiên cứu bảo mật và quyền riêng tư cho rằng, việc lan truyền dữ liệu dạng này đặt ra câu hỏi về khả năng bảo mật. Theo Sergei Egel, vấn đề ở đây là không có hậu quả rõ ràng nào xảy ra với các công ty coi thường việc bảo mật dữ liệu người dùng.
Mặc dù vậy, nhiều công ty tự nguyện thực hiện nhiều bước khác nhau khi khai thác dữ liệu nhằm đảm bảo tính riêng tư của người dùng.
Hình bên trái là một nhà máy điện hạt nhân. Trong khi đó, tấm hình bên phải là một nhà thờ. Các chấm vàng trong ảnh thể hiện vị trí của từng thiết bị di động. Đây rõ ràng đều là những thông tin vô cùng nhạy cảm. |
Với Sense360, một công ty dữ liệu chuyên về ngành dịch vụ ăn uống, công ty này xáo trộn dữ liệu người dùng trong một diện tích khoảng 300 mét vuông xung quanh vị trí gần đúng.
Trong khi đó, một công ty khác là Factual lại chọn cách che dấu địa chỉ thu thập dữ liệu nhằm đảm bảo tính riêng tư cho người dùng. Một số khác lại khẳng định họ sẽ xóa ngay lập tức các dữ liệu sau khi tiến hành phân phối xong nội dung quảng cáo.
Google và Facebook hiện là hai công ty thống trị thị trường quảng cáo trực tuyến. Điều này cũng đồng nghĩa, Google và Facebook chính là những ông trùm khi sở hữu lượng dữ liệu khổng lồ của hàng tỷ người dùng.
Cả 2 doanh nghiệp này đều cho biết, họ không bán dữ liệu người dùng mà sử dụng để cá nhân hóa chính dịch vụ của họ, bao gồm cả việc bán quảng cáo trên Internet. Google còn cho biết, họ đã sửa đổi dữ liệu ít nhiều để làm nó trở nên ít chính xác hơn.
Cùng với Apple, Google đang sở hữu những nền tảng hệ điều hành di động phổ biến nhất thế giới. Trong cuộc khủng hoảng về dữ liệu, cả iOS và Android đang thực hiện các biện pháp nhằm hạn chế việc các ứng dụng thu thập dữ liệu về vị trí.
Trong phiên bản mới nhất của hệ điều hành Android, khi không được người dùng sử dụng, các ứng dụng không được cập nhật vị trí liên tục mà chỉ được cho phép cập nhật vài lần mỗi giờ. Apple còn khắt khe hơn khi yêu cầu nhà phát triển giải trình việc đòi quyền truy cập khả năng định vị.
Tuấn Nghĩa - Trần Duy Tiến - Trần Thanh Thủy (Theo New York Times)