![]() |
| Ảnh minh họa |
Các nhà nghiên cứu cả trong giới hàn lâm và trong ngành di động đang mổ xẻ những cơ sở dữ liệu khổng lồ về các cuộc gọi và tin nhắn di động SMS để phát hiện ra thói quen đi lại hay thậm chí là các xu hướng xã hội.
Với các ứng dụng tiềm năng từ việc hoạch định thành phố đến tiếp thị, các nghiên cứu này có thể cung cấp nguồn doanh thu mới cho các nhà mạng. “Bởi vì điện thoại di động đã trở nên quá phổ biến, khai thác dữ liệu chúng tạo ra có thể thực sự cách mạng hóa các nghiên cứu về hành vi con người”, Ramon Caceres, phụ trách phòng nghiên cứu của nhà mạng AT&T ở Florham Park, bang New Jersey (Mỹ) nói.
Nếu bạn là thuê bao của nhà mạng AT&T và sinh sống gần Los Angeles hoặc New York vào thời gian từ ngày 15/3 năm ngoái đến 15/3 năm nay, có 5% cơ hội dữ liệu của bạn được Ramon Caceres và các đồng nghiệp của ông mổ xẻ trong nghiên cứu về thói quen đi lại của các thuê bao. Các nhà nghiên cứu này đã phân tích hàng triệu dữ liệu cuộc gọi từ hàng trăm nghìn người dùng ở 891 mã vùng từ thành phố New York đến các bang New Jersey và California của Mỹ.
Nguyên liệu của các nghiên cứu dữ liệu di động là bộ thông tin chi tiết cuộc gọi (CDR - call detail record). Mỗi kết nối tin nhắn SMS hoặc cuộc đàm thoại tạo ra một bộ CDR. Ngoài các thông tin về nguồn gốc cuộc gọi, số gọi đến và thời gian đàm thoại, dữ liệu quan trọng nhất của một bộ CDR là định danh của trạm thu phát sóng kết nối với điện thoại để truyền tin nhắn hay cuộc gọi. Định danh trạm thu phát sóng có thể xác định vị trí của người gọi và người nhận cuộc gọi hoặc nhắn tin.
![]() |
| Ảnh minh họa |
Qua phân tích dữ liệu chi tiết cuộc gọi, các nhà nghiên cứu có thể xác định được khoảng cách đi từ nhà của mỗi thuê bao hàng ngày. Nhóm nghiên cứu này phát hiện thấy trung bình mỗi người dân sống ở thành phố Manhattan (Mỹ) đi khoảng 2,5 dặm mỗi ngày, trong khi người dân ở Los Angeles đi khoảng 5 dặm hàng ngày. “Nhưng chúng tôi cũng phát hiện thấy khi xem xét các chuyến đi dài nhất, người sống ở New York thường đi xa hơn, 69 dặm vào ngày cuối tuần so với 29 dặm của người dân ở Los Angeles”, Ramon Caceres nói.
Ramon Caceres hy vọng sẽ hợp tác để cung cấp những thông tin này cho những nhà hoạch định chính sách của các đô thị, những người thường xuyên cần đến các khảo sát tốn kém để có những thông tin tương tự. “Loại dữ liệu này có thể giúp họ quyết định cách đầu tư các dự án trong thành phố như thế nào, ví dụ như nơi đầu nhà ga ngầm hay ga tàu mới”, Ramón Cáceres nói.
Hiện nay, nhóm nghiên cứu của Ramon Caceres tập trung tìm kiếm cơ hội hợp tác hơn là đi tìm đối tác thương mại hóa các nghiên cứu của họ. Nhưng các nhà mạng di động đang nghĩ tới việc kinh doanh dữ liệu của họ, Jean Bolot, nhà nghiên cứu của mạng di động Sprint nói vậy. Đây là mô hình kinh doanh “ăn cả hai mang”, nhà mạng không chỉ phục vụ các thuê bao của họ mà còn kiếm được tiền từ dữ liệu của thuê bao. “Đây là mỏ vàng với các nhà mạng mà không thể tìm thấy trong các lĩnh vực khác”, Jean Bolot nhận định.
Bởi vì hầu hết mọi người đều có điện thoại di động, do đó quy mô của dữ liệu di động lớn tới mức ít có nguồn dữ liệu nào có thể sánh bằng. Thông tin từ dữ liệu của người dùng di động có thể ứng dụng vào nhiều hoạt động, ví dụ có thể dùng để điều chỉnh giá quảng cáo biểu hiệu ngoài trời nhờ số liệu về thói quen đi lại của người dùng.
Một nghiên cứu khác của Francesco Calabrese và các đồng nghiệp ở Viện công nghệ Massachusets (Mỹ) đã phân tích dữ liệu của gần 1 triệu cuộc gọi ở Boston vào các thời điểm diễn ra các sự kiện lớn ở thành phố này như các trận bóng rổ nhằm phát hiện cách người dân tham gia các sự kiện này như thế nào. “Với nghiên cứu từ dữ liệu di động, chúng tôi có thể dự báo khá chính xác sự đi lại của người dân đối với những sự kiện đặc biệt”, Francesco Calabrese, trưởng nhóm thực hiện nghiên cứu trên của Viện công nghệ Massachusets khẳng định.
Sự gia tăng các nghiên cứu sử dụng dữ liệu di động cũng đặt ra câu hỏi về vấn đề bảo vệ thông tin riêng tư của người dùng. Vincent Blondel, giáo sư toán học ứng dụng ở đại học Catholique de Louvain của Bỉ cho rằng các nghiên cứu sử dụng dữ liệu di động nên loại bỏ thông tin tên và số người dùng trong các bộ dữ liệu CDR.
Theo Technology Review
Đọc toàn bộ bài viết trên báo Bưu điện Việt Nam số 68 ra ngày 7/6/2010.

