Giá trị của Dữ liệu mở là gì, vì sao Chính phủ nên mở dữ liệu?

VietTimes -- Mới đây, tại trường đại học Thăng Long, Hà Nội đã diễn ra hội thảo "Xây dựng và khai thác tài nguyên giáo dục mở". Hội thảo đã đề cập đến nhiều lợi ích và giá trị của dữ liệu mở đối với giáo dục. Trong khuôn khổ bài viết này, VietTimes xin giới thiệu bài viết của chuyên gia Nguyễn Thế Hùng về giá trị của dữ liệu mở đối với chính phủ và ngành giáo dục.

Dữ liệu mở là gì và nó đem lại những gì?

Dữ liệu mở (Open Data) là dữ liệu được cấp phép theo giấy phép mở, cho phép chúng ta tự do 3 việc sau đây: sử dụng và sử dụng lại, phân phối và phân phối lại (có thể tùy biến và pha trộn) [1].

Dữ liệu mở chỉ yêu cầu nhiều nhất 2 việc: Ghi công và chia sẻ tương tự.

Lưu ý tránh các sai lầm phổ biến:

●     Cần hiểu dữ liệu mở là dữ liệu có bản quyền, tránh nghĩ rằng miễn phí là không có bản quyền.

●     Việc tự do sử dụng bao gồm yếu tố miễn phí nhưng không chỉ là miễn phí vì một số dữ liệu được sử dụng miễn phí nhưng không phải là dữ liệu mở.

●     Dữ liệu mở ở đây không đề cập đến các dữ liệu của cá nhân và các dữ liệu liên quan đến bí mật quốc gia. Các dữ liệu này không nằm trong phạm vi khi nói đến dữ liệu cần phải mở.

Dữ liệu mở của Chính phủ

Dữ liệu mở của chính phủ là dữ liệu được các chính phủ cấp phép mở! Hình dưới đây sẽ minh họa điều này:

ảnh: Phân loại dữ liệu và dữ liệu mở trong chính phủ [8]
ảnh: Phân loại dữ liệu và dữ liệu mở trong chính phủ [8]

Giá trị của Dữ liệu mở là gì, tại sao Chính phủ nên mở dữ liệu?

Để biết giá trị của Dữ liệu mở, có thể tóm gọn bằng câu trả lời phỏng vấn của của giáo sư Hồ Tú Bảo [9] và cũng là trích dẫn trong báo cáo của World Bank (Ngân hàng Thế giới) [4]: "Dữ liệu mở chính là động lực để các doanh nghiệp SMEs cũng như start-ups tham gia vào nền kinh tế số của Việt Nam".

Chính phủ nên mở dữ liệu của mình vì đây là nguồn dữ liệu lớn và chất lượng, có nhiều giá trị có thể giúp thúc đẩy sự phát triển của doanh nghiệp và xã hội [2] [3] [5] [6]

hội thảo "Xây dựng và khai thác tài nguyên giáo dục mở" tại Đại học Thăng Long, Hà Nội
hội thảo "Xây dựng và khai thác tài nguyên giáo dục mở" tại Đại học Thăng Long, Hà Nội

 Có dữ liệu nhưng mở không dễ!

Năm ngoái, khi làm việc các cơ quan quản lý nhà nước để khảo sát và đánh giá về hiện trạng dữ liệu mở (hồi đó CLB phần mềm tự do nguồn mở Việt Nam (VFOSSA) giao nhiệm vụ cho tác giả bài viết làm thành viên trong đoàn khảo sát của Viện Công nghiệp phần mềm và nội dung số (Bộ TT&TT) về Dữ liệu mở trong khối cơ quan nhà nước dưới tư cách là chuyên gia tư vấn), có một vấn đề nổi cộm khi đoàn khảo sát đưa đề xuất về việc mở dữ liệu thì đều nhận được các câu trả lời chung là:

●     Các cơ quan quản lý nhiều khi muốn mở nhưng không biết mở như thế nào vì không có hướng dẫn về quyền hạn và nghĩa vụ của việc này.

●     Vấn đề thứ 2 là vấn đề của chính dữ liệu: chất lượng dữ liệu, bản quyền dữ liệu và việc loại bỏ dữ liệu riêng tư/ cá nhân nằm trong đó.

Một số đơn vị đã “thí điểm mở” bằng việc cấp phép cho một số doanh nghiệp start-up truy cập dữ liệu nhưng sau đó phải dừng lại vì các nguyên nhân liên quan đến việc không có khả năng loại bỏ dữ liệu riêng tư trong đó.

Có dữ liệu có thể mở nhưng... có muốn mở hay không?

Lại có chỗ dữ liệu sẵn sàng trở thành dữ liệu mở, ví dụ các thông tin bị bắt buộc phải công khai theo điều 10 và 17 của Luật tiếp cận thông tin, một phần trong số dữ liệu này của chính phủ chỉ cần bổ sung thêm giấy phép là ngay lập tức trở thành dữ liệu mở. Tuy nhiên các cơ quan quản lý chúng muốn cấp giấy phép mở cho chúng hay không lại là chuyện khác.

Cá nhân người viết bài đã từng góp ý một cơ quan sở hữu các dữ liệu này để cấp phép mở cho chúng với khẳng định rằng đơn vị này sẽ trả thành cơ quan đầu tiên ở Việt Nam cấp phép mở cho dữ liệu của chính phủ theo đúng xu thế mà Văn phòng chính phủ (VPCP) và WorldBank đang vận động [4] nhưng không nhận được câu trả lời từ đơn vị này.

Cạnh tranh khai thác dữ liệu của chính phủ không lành mạnh vì dữ liệu chưa được mở

Dữ liệu đáng ra phải mở nhưng thiếu giấy phép nên chỉ có số ít doanh nghiệp dám khai thác, thậm chí một số dữ liệu thiếu công khai nên xuất hiện hiện tượng doanh nghiệp bắt tay với một vài chân trong nhằm khai thác ngầm dữ liệu của chính phủ. Điều này khiến doanh nghiệp cạnh tranh với nhau không lành mạnh, không tạo ra lợi ích cho xã hội từ việc khai thác dữ liệu.

Còn nhớ dữ liệu điểm thi đại học vài năm trước bị o bế, một số doanh nghiệp nhanh nhạy kinh doanh dịch vụ bắt tay với một vài cá nhân để copy ra ngoài kinh doanh. Đột nhiên năm 2015 việc bắt tay không trót lọt, chính những doanh nghiệp này bị quy tội lừa đảo và bị phạt tiền [7].

Một số cơ quan nhà nước còn giữ độc quyền dữ liệu để tự kinh doanh các dịch vụ dựa trên dữ liệu của chính phủ. Nguy cơ hiện hữu là các đơn vị này sẽ tìm cách giữ nó “độc quyền tự nhiên” nhằm tạo lợi thế kinh doanh.

Năm 2018, khi công ty cổ phần phát triển nguồn mở Việt Nam triển khai Phần mềm khai thác thông tin thầu (DauThau.INFO) ngay lập tức nhận được cảnh báo về việc sẽ bị “đụng chạm” với các nhóm lợi ích. Quả thực, chỉ trong thời gian ngắn đã có nhiều bên liên hệ dọa kiện cáo vì “tiết lộ thông tin” của nhà thầu, vài tháng sau bị thanh tra kiểm tra. May mắn là nhờ mọi thứ chỉn chu, sổ sách cẩn thận, tuân thủ pháp luật cho nên kết quả thanh tra đủ các mảng kinh doanh sau 10 ngày chỉ có 1 kết luận duy nhất là mọi thứ đều đúng quy định.

Tất nhiên, để có được chữ “đúng quy định pháp luật” thì bản thân việc hiểu biết về bản quyền, về dữ liệu, về pháp luật có liên quan thì khỏi phải nói, đó là cả một rừng các viện dẫn. Chỉ riêng về các căn cứ thì DauThau.INFO đã có “cả mớ” trang tài liệu như Điều khoản sử dụng, Chính sách bảo mật, Cam kết dịch vụ, Tuyên bố bản quyền... thực ra cuối cùng cũng chỉ để bảo vệ chính mình và khẳng định việc khai thác các dữ liệu này là đúng pháp luật.

Hy vọng cho một tương lai dữ liệu mở từ Chính phủ

Với sự cổ vũ mạnh mẽ từ tất cả các cấp, các phong trào như: chính phủ điện tử, chính phủ số, start-up, quốc gia khởi nghiệp... đã góp phần thúc đẩy dữ liệu mở được quan tâm nhiều hơn. Đầu năm nay, văn phòng chính phủ cùng với Ngân hàng Thế giới (World Bank) đã tổ chức một số hội thảo về dữ liệu mở [4] và công bố những báo cáo đầy khả quan về mảng này.

Quá trình khảo sát với các cơ quan nhà nước cũng cho thấy nhiều cơ quan quản lý nhà nước hiện cũng khá cởi mở với việc mở dữ liệu. Một thế hệ lãnh đạo trẻ, có hiểu biết đang dần thay đổi nhận thức về việc phải mở dữ liệu. Chỉ còn chờ một cơ chế làm sao để việc mở dữ liệu là mặc định từ phía chính phủ. Ví dụ đưa ra các quy định chỉ rõ dữ liệu nào buộc phải cấp phép mở (giống như luật tiếp cận thông tin).

Khi dữ liệu được mở, một thế hệ doanh nghiệp đổi mới sáng tạo sẽ được ra đời để khai thác dữ liệu này. Khi dữ liệu này được khai thác, nó sẽ tạo ra nhiều lợi ích cho người dân, chính phủ và chính doanh nghiệp. Nói cho cùng, lúc này doanh nghiệp sẽ trở thành cánh tay nối dài của chính phủ trong việc giúp khai thác dữ liệu để phục vụ nhân dân. Đây là một cách huy động nguồn lực doanh nghiệp một cách thông minh để “xã hội hóa” các dịch vụ từ dữ liệu mà nhà nước chưa thể làm để phục vụ nhân dân.

Dữ liệu mở của chính phủ sẽ là nguồn nhiên liệu cho công cuộc thúc đẩy việc sản sinh ra các start-up đổi mới sáng tạo tại Việt Nam. Thực tế, việc này không khó vì có nhiều loại dữ liệu công khai hoàn toàn có thể biến thành dữ liệu mở ngay (như báo cáo của NISCI [6] và World Bank [4] đã kiến nghị). Với các loại dữ liệu này, chính phủ có thể ngay lập tức ban hành quy định về các loại dữ liệu của chính phủ và cơ quan nhà nước (sử dụng 100% ngân sách nhà nước, đã được công khai và cho phép tiếp cận theo luật tiếp cận thông tin) bắt buộc phải cung cấp theo giấy phép dữ liệu mở. Như vậy, việc thúc đẩy đổi mới sáng tạo (nhờ dữ liệu mở của chính phủ) là trong tầm tay, và tiến trình này nhanh hay chậm, hoàn toàn do chính phủ quyết định!

Ông Nguyễn Thế Hùng chia sẻ về kinh nghiệm xây dựng, triển khai và vận hành kho bài giảng, kho học liệu mở e-learning của Bộ Giáo Dục
Ông Nguyễn Thế Hùng chia sẻ về kinh nghiệm xây dựng, triển khai và vận hành kho bài giảng, kho học liệu mở e-learning của Bộ Giáo Dục

Dữ liệu mở trong Giáo dục -- Hiện trạng buồn ở Việt Nam

Việt Nam chưa có nhiều kho tài nguyên giáo dục mở, hiểu biết về bản quyền tài nguyên số và tài nguyên giáo dục mở còn hạn chế khiến cho việc xây dựng các kho tài nguyên giáo dục mở ở Việt Nam không khả thi với các hình thức sử dụng nguồn lực cộng đồng.

Kho tài nguyên giáo dục mở đầu tiên là VOER được sinh ra từ dự án của chương trình Tài nguyên Giáo dục Mở Việt Nam (hỗ trợ bởi Quỹ Việt Nam, The Vietnam Foundation - VNF). Tuy nhiên kho này kể từ sau khi dự án hoàn thành thì tài nguyên không được đóng góp thêm bao nhiêu [10] mặc dù hệ thống vẫn hoạt động tốt và chức năng đóng góp hoạt động bình thường. Một loạt các dự án sau đó cũng rơi vào tình trạng tương tự.

Giải pháp nào cho việc này?

Nhận định việc sử dụng nguồn lực cộng đồng tình nguyện ở Việt Nam là chưa khả thi trong bối cảnh hiện tại, năm 2016, công ty cổ phần phát triển nguồn mở Việt Nam (VINADES) đã thử nghiệm mô hình mới là tư vấn để hướng các cuộc thi phong trào trở thành nơi để phổ cập về bản quyền nội dung số, sản phẩm nộp dự thi chính là tài nguyên giáo dục mở. Cuộc thi đầu tiên được tư vấn là Cuộc thi quốc gia Thiết kế bài giảng e-Learning lần thứ 4 [11], song song đó là việc hỗ trợ xây dựng kho học liệu mở để khai thác các tài nguyên này [12].

Để đơn giản nhất, hệ thống vận hành sử dụng NukeViet CMS - một phần mềm nguồn mở của người Việt (do công ty VINADES cùng cộng đồng lập trình viên người Việt phát triển). Sau đó, VINADES viết thêm 1 module đơn giản để khai thác kho học liệu với chức năng xem bài giảng online, tải về bài giảng (đã đóng gói) và bình luận/ bình chọn bài giảng.

Kết quả là với 800 bài lọt vòng chung khảo với hai nhóm chủ đề là dư địa chí và chủ đề theo môn học, Bộ GD&ĐT đã có một kho bài giảng chất lượng tốt, trải dài ở tất cả các môn học từ các giáo viên trên toàn quốc. Tất cả các bài giảng cho kho học liệu mở được cấp theo giấy phép mở CC-BY [13] hoặc CC-BY-SA [14] tùy lựa chọn của tác giả. Bài giảng có thể cho người truy cập học trực tuyến miễn phí không cần đăng nhập và tải về để học (cần đăng ký tài khoản và đăng nhập để tải về).

Tuy nhiên, hiện tại kho học liệu mới chỉ dừng ở phạm vi cuộc thi, chưa cho phép giáo viên tự tải lên bài giảng để chủ động đóng góp, việc này có trong định hướng nhưng vẫn phụ thuộc vào kế hoạch của Bộ GD&ĐT. Cần nhận thức rằng: Chừng nào giáo dục mở và tài nguyên giáo dục mở chưa phải là quốc sách của Việt Nam hay chính sách của Bộ GD&ĐT thì khi đó việc thay đổi căn bản và toàn diện nhờ giáo dục mở vẫn là điều khó. Dẫu vậy, hành trình vạn dặm đều cần bước chân đầu tiên, chúng ta hãy bắt đầu từ cái nhỏ và sử dụng tất cả những gì có thể làm để khởi đầu, sử dụng bất kỳ công nghệ nào, bất kỳ hình thức nào để thúc đẩy tài nguyên giáo dục mở, khi nhận thức thay đổi, xã hội sẽ tiến lên.

Chú thích:

[1] Open Data: http://opendatahandbook.org/guide/en/what-is-open-data/

[2] Tạp chí Tia Sáng - Hiểu đúng về chính phủ mở (28/12/2018): http://tiasang.com.vn/-dien-dan/Hieu-dung-ve-chinh-phu-Mo-14077

[3] Báo Đầu Tư - Dữ liệu mở sẽ là chìa khóa cho khu vực kinh tế tư nhân (02/05/2019): https://baodautu.vn/du-lieu-mo-se-la-chia-khoa-cho-khu-vuc-kinh-te-tu-nhan-d99590.html

[4] "Báo cáo đánh giá Mức độ sẵn sàng về Chính phủ số và Dữ liệu Mở tại Việt Nam" do VPCP và World Bank VN thực hiện (Tháng 2/2019): http://egov.chinhphu.vn/Resources/2019_09_03/37750/WB_ChinhphuSovaDulieuMo_VN_FINAL.pdf

[5] Báo cáo tổng quan về dữ liệu mở của Viện CNPM&NDS (13/10/2017): http://www.nisci.gov.vn/?mdocs-file=806

[6] Báo cáo một số vấn đề về sự cần thiết ban hành các qui định, chính sách về dữ liệu mở của Viện CNPM&NDS (01/11/2017): http://www.nisci.gov.vn/?mdocs-file=1197

[7] Goldsoft và INET bị phạt 140 triệu đồng vì quảng cáo "lừa đảo" về dịch vụ tra cứu điểm thi: http://cafebiz.vn/phap-luat/goldsoft-va-inet-bi-phat-140-trieu-dong-vi-quang-cao-lua-dao-ve-dich-vu-tra-cuu-diem-thi-20150731173115726.chn

[8] Università Ca’ Foscari Venezia, Open data: uno strumento per la lotta alla corruzione nelle ubbliche Amministrazioni (Dữ liệu mở: một công cụ cho cuộc chiến chống tham nhũng trong chính quyền hành chính), 2016/2017: http://dspace.unive.it/bitstream/handle/10579/12831/841094-1219891.pdf

[9] Forbesvietnam - Bao giờ Việt Nam có dữ liệu mở? (03/11/2018): https://forbesvietnam.com.vn/tin-cap-nhat/bao-gio-viet-nam-co-du-lieu-mo-4713.html

[10] Lịch sử đóng góp trên Kho Tài nguyên Giáo dục Mở Việt Nam: https://voer.edu.vn/browse

[11] Cuộc thi quốc gia Thiết kế bài giảng e-Learning hướng tới tài nguyên giáo dục mở: https://ictnews.vn/cntt/cuoc-thi-quoc-gia-thiet-ke-bai-giang-e-learning-huong-toi-tai-nguyen-giao-duc-mo-139695.ict

[12] Kho bài giảng e-Learning của Bộ giáo dục: https://elearning.moet.edu.vn

[13] Giấy phép CC-BY: https://creativecommons.org/licenses/by/3.0/vn/

[14] Giấy phép CC-BY-SA: https://creativecommons.org/licenses/by-sa/3.0/vn/

[15] Kinh nghiệm xây dựng, triển khai và vận hành kho bài giảng, kho học liệu mở e-learning của Bộ Giáo Dục & ví dụ về DauThau.INFO phần mềm khai thác dữ liệu thầu giúp minh bạch hóa hoạt động đấu thầu của nhà nước: http://giaoducmo.avnuc.vn/hoi-thao/du-lieu-mo-trong-giao-duc-va-chinh-phu-37.html