Cần làm gì khi "Dữ liệu Lớn" quá lớn?

VietTimes -- Vào những năm 1950, các nhà khoa học đã đưa ra kết luận rằng, bộ não con người chỉ có thể nhớ lại một danh sách khoảng bảy vấn đề. Năng lực của não từ đó không có nhiều thay đổi - nhưng lượng dữ liệu dội vào trí óc chúng ta thì chắc chắn đã lớn hơn trước rất nhiều.
Dữ liệu Lớn rất cần thiết nhưng cũng không phải lúc nào cũng cần lớn
Dữ liệu Lớn rất cần thiết nhưng cũng không phải lúc nào cũng cần lớn

Don Sullivan, giám đốc tiếp thị dòng sản phẩm của VMware cho biết: "Chúng ta có tất cả các dữ liệu mà chúng ta cần, nhưng điều mà chúng ta thiếu hụt trong các công ty là những con người có kinh nghiệm trong công việc có thể rút ra từ việc phân tích dữ liệu để rồi tạo ra cơ hội đột phá cho công việc kinh doanh”.

Tôi cùng Sullivan tham dự Hội nghị thượng đỉnh Microsoft PASS được tổ chức mới đây. Hội nghị này dành cho các chuyên gia phân tích dữ liệu Lớn và các chuyên gia phân tích có sử dụng nền tảng và công cụ của Microsoft và các nền tảng liên quan để phân tích.

Tại hội nghị, tôi thấy nhiều công cụ tự động hóa cơ sở dữ liệu hấp dẫn có thể kết hợp các bộ dữ liệu rời rạc và thực hiện những động tác ảo diệu với các cơ sở dữ liệu và các ứng dụng. Tuy nhiên, cuộc hội thảo này cũng còn thiếu sự trao đổi về vấn đề làm thế nào để rút từ kho báu dữ liệu này những chất liệu phù hợp và biến đổi chúng thành giá trị kinh doanh có ý nghĩa.

Tôi rời hội nghị với câu hỏi: Dữ liệu lớn (và phân tích) phải lớn thế nào để thu được giá trị kinh doanh?

Trong mạng lưới giám sát và sản xuất, chúng ta có các máy móc có thể “hội thoại” với nhau trên mặt bằng nhà máy, các điểm đầu cuối trong mạng lưới của doanh nghiệp cũng có thể “nói chuyện” với nhau. Trong luồng thông tin đó có nhiều thông tin có giá trị - nhưng cũng có những dòng thông tin vô nghĩa. Liệu một quản trị viên mạng có cần điều này?

Nhãn mã vạch hiện nay có thể lên tới 7000 ký tự dữ liệu về một mặt hàng. Ví dụ, mã vạch trên một chiếc áo len có thể cho bạn biết chiếc áo đó được cấu thành từ bao nhiêu mũi khâu. Nhưng liệu bạn cần thông tin đó, nếu như công việc của bạn chỉ yêu cầu phải đảm bảo rằng mặt hàng đã rời nhà máy sản xuất đúng thời hạn và sẽ được chuyển đến các kho hàng hoặc cửa hàng bán lẻ đúng hạn vào dịp những ngày nghỉ?

Nói cách khác, cho dù chúng ta đang nói về đầu ra của mạng, về những chiếc áo len hoặc tín hiệu video truyền hình, thì dường như có một điểm tới hạn, khi lợi nhuận giảm thì giá trị bạn nhận được từ dữ liệu bắt đầu giảm.

Có hai điểm kích hoạt chính làm giảm giá trị dữ liệu:

Dữ liệu bắt đầu được tạo ra mà không có mục tiêu mặt kinh doanh để làm việc đó.

Dữ liệu được trình bày với độ phức tạp quá mức mà người dùng đơn giản là không biết phải làm gì với nó

Dưới đây là cách bạn có thể chống lại các sự kích hoạt này:

Chiến lược tránh tạo dữ liệu trong trường hợp không có mục tiêu kinh doanh

Luôn luôn xác định một cách rõ ràng lý do triển khai kinh doanh với kết quả mong muốn (ví dụ giảm chi phí vận hành trong sản xuất) trước khi thiết kế trung tâm dữ liệu, kết nối IoT, vv ... bạn càng tập trung hẹp vào mục tiêu, nhân viên của bạn càng có khả năng duy trì công việc.

Mỗi tuần, hãy kiểm tra các dự án phân tích dữ liệu của bạn để không bị "trôi dạt" ra xa. Nói cách khác, cần kiểm tra xem liệu có phải dự án bắt đầu đi chệch khỏi định hướng ban đầu so với mục tiêu hay không? Nếu bạn thấy một dự án bắt đầu chệch hướng, hãy điều chỉnh và hướng trở lại đúng mục tiêu kinh doanh.

Đừng bao giờ để các kỹ thuật viên nắm riêng một dự án phân tích. Nếu bạn thiếu người am hiểu về doanh nghiệp, dự án đó có thể là kiệt tác kỹ thuật, nhưng sẽ là thất bại trong kinh doanh. Để tránh rủi ro này, vai trò dẫn dắt dự án phải là thuộc về người sử dụng kết quả am hiểu  kinh doanh hoặc nhà phân tích kinh doanh CNTT để đảm bảo sự phản ánh trung thực giữa dự án và mục tiêu kinh doanh.

Chiến lược ứng phó với trường hợp dữ liệu quá phức tạp, thậm chí quá nhiều

Hình minh họaHình minh họa

Hiểu rõ nhu cầu của người sử dụng kết quả cuối cùng, trước khi bắt đầu thiết kế một ứng dụng phân tích. Nếu một người dùng dữ liệu phải thực hiện công việc ngoài trời, vận chuyển hàng hóa trong sân kho giữa trời mưa lạnh, cái họ cần không phải là đánh vật với các menu trên màn hình thiết bị di động, mà chỉ cần mấy cái ảnh trực quan chỉ rõ vị trí của xe đầu kéo, một vài đặc điểm nổi bật của hàng hóa. Thể là đủ.

Đánh dấu tại dòng dưới cùng mục tiêu công việc của bạn. Nếu mục tiêu là xem có bao nhiêu trường hợp bị mắc cúm ở các quận khác nhau của thành phố, hãy đánh dấu lại. Dự án sau có thể là thêm một lớp thông tin bổ sung như tỷ lệ thất nghiệp trong nhân khẩu học ... nhưng đó không phải là câu chuyện của hôm nay.

Theo TechRepublic