Theo các chuyên gia từ AWS, từ những dữ liệu đầu vào như: văn bản, hình ảnh, số liệu, video... hệ thống máy tính (AI, máy học) có thể phân tích để đưa ra các dự báo. Kết quả thu được sẽ góp phần quan trọng giúp doanh nghiệp hay chính quyền đưa ra quyết định. Đó là lý do dữ liệu được xem như nguồn tài nguyên sống còn của các tổ chức. 

Tuy vậy, dữ liệu trước đây được các bên thu thập rất thô sơ, không được phân loại. Chẳng hạn, một doanh nghiệp lưu trữ khá đầy đủ thông tin khách hàng, nhưng đã phân loại theo tuổi tác, ngành nghề, giới tính, nơi ở của khách hàng... hay chưa. Nếu chưa, việc sử dụng dữ liệu này cho các kế hoạch kinh doanh sau đó sẽ phải tốn nhiều thời gian hơn. Chưa kể các khối dữ liệu khác của công ty như tài chính, kế toán, sản phẩm, nhà máy...

Nên có chuyên gia phân loại dữ liệu

Trong một hội thảo về trí tuệ nhân tạo tại TP.HCM, Thứ trưởng Bộ Khoa học và Công nghệ Bùi Thế Duy cho hay trong quá trình thực hiện liên thông dữ liệu phục vụ chuyển đổi số, nhiều đơn vị tá hoả vì thông tin thu thập được là dạng dữ liệu thô, chưa được phân loại. Vì thế các dữ liệu này khó có thể đưa ngay vào sử dụng.

Vì vậy, Thứ trưởng Bùi Thế Duy cho rằng ở ngay giai đoạn bắt đầu thu thập dữ liệu, các tổ chức cần có cách phân loại khoa học để có thể sử dụng cho chuyển đổi số.

Dữ liệu thu thập sơ sài không chỉ là vấn đề tại Việt Nam. Ông Wayne Duso, Phó Chủ tịch phụ trách mảng lưu trữ và dịch vụ dữ liệu tại AWS cho hay, các doanh nghiệp trong khu vực châu Á - Thái Bình Dương cũng gặp tình trạng tương tự. Hơn 40% doanh nghiệp khi được hỏi cho rằng dữ liệu của họ thu thập có chất lượng khá nghèo nàn.

 Ông Wayne Duso, Phó chủ tịch phụ trách mảng lưu trữ và dịch vụ dữ liệu tại AWS. Ảnh: AWS

Để nhóm dữ liệu này có thể sử dụng được, ông Wayne cho rằng các tổ chức, doanh nghiệp có thể tìm tới các nhà cung cấp dịch vụ đám mây. Những nhà cung cấp này sẽ có giải pháp để phân loại dữ liệu, biến chúng thành tài sản phục vụ chuyển đổi số.

“Các nhà cung cấp sẽ biết cách làm sạch dữ liệu, gắn nhãn dữ liệu và tiến hành phân loại dữ liệu. Sau đó, nguồn dữ liệu này sẽ chất lượng hơn để phục vụ việc phân tích, đưa vào các thao tác phức tạp hơn, ví dụ cho máy học chẳng hạn”, ông Wayne nói.

Có thể xoá bớt dữ liệu để tiết kiệm chi phí lưu trữ không?

Ông Wayne nhấn mạnh trong quá trình chuyển đổi số của tổ chức, dữ liệu chỉ đứng sau con người về mức độ quan trọng.

Nhưng liệu có dạng dữ liệu nào có thể xoá đi để tiết kiệm dung lượng lưu trữ, tiết kiệm tiền hay không? Trả lời câu hỏi này, ông Wayne cho rằng có thể xoá bớt một số dữ liệu nhưng phải rất chắc chắn rằng các thông tin đó không cần thiết.

“Ví dụ bạn có 10 phiên bản khác nhau của một file thuyết trình thì có thể xoá đi 8-9 file ban đầu, chỉ cần giữ lại file cuối cùng. Tuy nhiên với những dạng dữ liệu khác thì phải thật cân nhắc vì sẽ không biết khi nào cần tới chúng”, ông Wayne nói.

Phó Chủ tịch AWS dẫn câu chuyện của chính ông, rằng ông đã mày mò tạo ra một công cụ cho phép khách hàng của công ty có thể tiết kiệm được đến 92% chi phí khi sử dụng một trong các dịch vụ do công ty ông cung cấp. Để làm được điều này, ông mất 7 năm để nghiên cứu dựa trên một khối lượng dữ liệu cũ.

“Tôi đã tìm được nguyên lý trong mớ dữ liệu kia để giúp khách hàng tiết kiệm chi phí hơn. Nhưng cần nhắc lại là tôi đã mất tổng cộng 7 năm để làm được điều đó”, ông Wayne nói. Do đó, vị này cho rằng các doanh nghiệp nên có chiến lược thông thái trong việc lưu trữ dữ liệu phòng khi có thể dùng lại sau này.

Cuối cùng, vị chuyên gia cho rằng, doanh nghiệp nên có chiến lược dữ liệu ngay từ đầu. Với dữ liệu đã thu thập trước đó nhưng ở dạng chưa thể dùng được thì hãy tìm đến các chuyên gia để được hỗ trợ.

Hải Đăng