Trong dòng thác dữ liệu liên tục được tạo ra từng giây, thuật ngữ Big Data (Dữ liệu lớn) được sử dụng để chỉ những bộ dữ liệu khổng lồ, chủ yếu không có cấu trúc, được thu thập từ nhiều nguồn khác nhau. Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực. Trong công tác nghiên cứu khoa học, Big Data đang mang lại các nhà nghiên cứu cơ hội tiếp cận và giải quyết rất nhiều vấn đề hóc búa mà trước đây không thể hoặc rất khó thực hiện.

Đến nay, đã có khá nhiều nước triển khai các dự án nghiên cứu khai thác, sử dụng nguồn Big Data để sản xuất số liệu thống kê giá, di cư, du lịch…

{keywords}
Đến nay, đã có khá nhiều nước triển khai các dự án nghiên cứu khai thác, sử dụng nguồn Big Data để sản xuất số liệu thống kê giá, di cư, du lịch…

Theo tinh thần của Đề án ứng dụng công nghệ thông tin - truyền thông trong Hệ thống thống kê nhà nước giai đoạn 2017 - 2025, tầm nhìn đến năm 2030, ngành thống kê bên cạnh nhiệm vụ đẩy mạnh sử dụng công nghệ thông minh vào các công đoạn điều tra, còn có nhiệm vụ khác là sử dụng công nghệ dữ liệu lớn để hiện đại hóa, giảm chi phí và tăng chất lượng, khả năng dự báo trong một số lĩnh vực thống kê, tập trung ứng dụng công nghệ dữ liệu lớn trong lĩnh vực thống kê giá, thị trường bất động sản, đất đai, di cư nội địa, trong đó, nghiên cứu, ban hành phương pháp ứng dụng công nghệ dữ liệu lớn trong hoạt động thống kê nhà nước, trước mắt trong biên soạn chỉ số giá tiêu dùng (chỉ số CPI).

Các nội dung chủ yếu gồm: Xây dựng quy trình tính, xác định nguồn dữ liệu; thu thập dữ liệu từ các tổ chức, mạng lưới, doanh nghiệp đã xác định; tính toán chỉ số giá của các hàng hóa và dịch vụ được lựa chọn; phân tích kết quả và so sánh với phương pháp truyền thống. Tiến hành thí điểm ứng dụng dữ liệu lớn trong tính chỉ số CPI cho khu vực thành thị, thống kê thị trường bất động sản trong năm 2019 và triển khai mở rộng từ năm 2020.

Ngoài ra, hiện đại hóa hoạt động phổ biến thông tin thống kê. Cụ thể, đổi mới trang thông tin điện tử của Tổng cục Thống kê thành kênh phổ biến thông tin thống kê chủ yếu của ngành Thống kê, đáp ứng yêu cầu phổ biến thông tin thuộc Hệ thống chỉ tiêu thống kê quốc gia, bộ chỉ tiêu phát triển bền vững của Việt Nam và các sản phẩm thông tin thống kê chủ yếu; phổ biến, giáo dục kiến thức thống kê và khảo sát sự hài lòng, nhu cầu thông tin của người dùng tin thông qua internet.

Xây dựng, cập nhật các cơ sở dữ liệu kinh tế - xã hội vĩ mô phổ biến trên trang thông tin điện tử của Tổng cục Thống kê. Tạo dựng các công cụ, phần mềm hỗ trợ người dùng tin khai thác, sử dụng, trình bày dữ liệu theo nhu cầu; tin học hóa quy trình tổng hợp, phổ biến Báo cáo kinh tế - xã hội hàng tháng, Niên giám thống kê quốc gia và một số sản phẩm thông tin chủ yếu khác thông qua việc ứng dụng hình ảnh hóa dữ liệu thống kê.

Tuấn Anh, Thành Huế