Quản trị dữ liệu trong bối cảnh xây dựng chính phủ số – đặc điểm và cơ hội

Bài viết này với mong muốn nêu những thay đổi và đề xuất ý tưởng về các định hướng và giải pháp quản trị dữ liệu số cho một vài lĩnh vực liên quan như phát triển học liệu số (nội dung trọng tâm trong xây dựng đại học số) hay lưu trữ số. Mở rộng ra, chúng ta hoàn toàn có thể dựa trên các giải pháp quản trị dữ liệu số để kiến giải cách thức tổ chức và xử lý dữ liệu trong mô hình chính phủ số.

Theo quan niệm truyền thống, quản trị dữ liệu bao gồm việc thiết lập và thực thi các chính sách, quy trình, tiêu chuẩn để đảm bảo dữ liệu được quản lý hiệu quả, an toàn và tuân thủ quy định của pháp luật, nhắm tới mục tiêu đảm bảo dữ liệu chính xác, toàn vẹn và có thể sử dụng được để hỗ trợ các quyết định trong hoạt động của các tổ chức (organizations). 

Từ trước đến khi diễn ra chuyển đổi số, các chức năng của quản trị dữ liệu luôn tập trung vào việc chuẩn hóa, tối ưu hóa quá trình thu thập, tổ chức, xử lý, lưu trữ, phân quyền truy cập, bảo vệ an toàn dữ liệu để phục vụ sự vận hành của một tổ chức điện tử (electronic organization) như chính phủ điện tử (e-Government), doanh nghiệp điện tử (e-Enterprise), giáo dục điện tử (e-Education),… Toàn bộ hệ thống quản trị dữ liệu phụ thuộc vào chất lượng của dữ liệu gốc được thu thập. Trong phương thức quản lý điện tử, dữ liệu được thu thập bởi con người, vì thế, ngay từ đầu, dữ liệu thu thập được đã không chính xác, không đầy đủ, không tức thời do bị ảnh hưởng bởi hạn chế vật lý của con người. Vì thế, mọi nỗ lực xây dựng hệ thống quản trị dữ liệu chỉ mang lại kết quả không hoàn hảo bởi hạn chế tự thân của phương thức quản lý điện tử.

Khi tiến hành chuyển đổi số, việc thu thập dữ liệu được giao cho IoT, vì thế, dữ liệu luôn đầy đủ, chính xác, minh bạch và theo thời gian thực (thu thập được dữ liệu ngay tại thời điểm vụ việc phát sinh). Đó là những phẩm chất mà thu thập dữ liệu thủ công không bao giời đạt được. Có dữ liệu là có tất cả! Bởi vậy, khi thu thập được dữ liệu đầy đủ, chính xác, minh bạch và theo thời gian thực, mọi quá trình phía sau thay đổi hoàn toàn, tạo ra cơ hội đầy tiềm năng cho việc phát triển các tổ chức số (digital organizations viết tắt là d-Organization). Trong tổ chức số đó, các phương pháp và công cụ đảm bảo quản trị dữ liệu tối ưu thay đổi hoàn toàn so với trước.

Đặc điểm của quản trị dữ liệu trong hệ thống điện tử

Ngay từ khi máy tính điện tử được đưa vào sử dụng (bắt đầu phổ biến từ thập niên 1960), người ta đã chú trọng đến việc phát triển và hoàn thiện về quản trị dữ liệu. Sau hơn nửa thế kỷ, mặc dù các giải pháp công nghệ được áp dụng để quản trị dữ liệu đã đạt tới trình độ rất cao nhưng những đặc tính của quản trị dữ liệu trong quá trình phát triển các tổ chức điện tử vẫn không thay đổi. Dưới đây là những đặc điểm chính. 

Nguồn gốc dữ liệu: Dữ liệu được thu thập bởi con người. Con người thu thập chứng từ, đo luờng, ghi chép số liệu và nhập vào máy tính để xử lý. Dữ liệu do con người thu thập có những đặc điểm cố hữu là: không đầy đủ (con người không thể thu thập được mọi loại dữ liệu), không khách quan (vì bị ảnh hưởng bởi năng lực chủ quan của con người), không kịp thời (con người không thể thu thập dữ liệu phát sinh theo thời gian thực). Trong thực tế, con người chỉ thu thập được các dữ liệu quá khứ (khi vụ việc đã diễn ra). Những đặc điểm này phát sinh từ hạn chế vật lý của con người.

Phương pháp tổ chức và xử lý dữ liệu: Quy trình quản lý điện tử (e-management) được hình thành từ việc điện tử hóa (nước ta hay gọi là tin học hóa) quy trình quản lý thủ công. Quản lý thủ công luôn hướng theo các chức năng cần giải quyết, vì vậy các sản phẩm điện tử hóa (các phần mềm quản lý) cũng được phát triển theo chức năng, kéo theo phương pháp tổ chức dữ liệu theo chức năng để phục vụ các phần mềm quản lý này (ví dụ kế toán, nhân sự, khách hàng,…). Các phần mềm quản lý được “lập trình cứng” (lập trình thế nào thì chạy thế), vì thế không đáp ứng được những biến động diễn ra liên tục trong thực tiễn hoạt động của tổ chức.

Cách thức quản trị chia sẻ dữ liệu: Khái niệm “chia sẻ dữ liệu” chỉ tồn tại trong bối cảnh cát cứ dữ liệu. Hiện tượng phổ biến là gần như tất cả các tổ chức, doanh nghiệp sở hữu hệ thống dữ liệu phân tán trên nhiều nền tảng khác nhau, từ hệ thống ERP, CRM đến các kho dữ liệu phi cấu trúc. Việc đồng bộ hóa và tích hợp các hệ thống này để đảm bảo tính nhất quán của dữ liệu là một thách thức lớn. Việc phát triển các hệ thống ứng dụng theo chức năng là nguyên nhân dẫn đến cát cứ dữ liệu vì thế mới có nhu cầu chia sẻ dữ liệu – một việc không dễ dàng ngay cả trong cùng một hệ thống (ví dụ giữa các phòng, ban của doanh nghiệp ở mức vi mô hay giữa các cơ quan chính phủ ở mức vĩ mô). Những giải pháp công nghệ được áp dụng để chia sẻ dữ liệu như xây dựng kho dữ liệu dùng chung hay nền tảng tích hợp và chia sẻ dữ liệu (LGSP) hầu như là những nỗ lực ứng phó hơn là giải pháp chia sẻ dữ liệu đúng nghĩa.

Bảo vệ an toàn dữ liệu: Dữ liệu được xem là nguồn tài nguyên quý giá nhất. Vì thế, bảo vệ an toàn dữ liệu luôn được đặt lên hàng đầu. Các phương pháp bảo vệ dữ liệu phổ biến như mã hóa dữ liệu, sao lưu và phục hồi dữ liệu, kiểm soát truy cập, ngăn ngừa xâm nhập trái phép,… ngày càng được hoàn thiện, Tuy nhiên, với nguồn gốc và đặc điểm về tổ chức và xử lý dữ liệu hiện nay, những phương pháp bảo vệ dữ liệu này vẫn chưa đảm bảo mức độ an toàn thật sự tin cậy.

Quản trị dữ liệu trong bối cảnh xây dựng chính phủ số - đặc điểm và cơ hội - datta

Mô hình quản trị dữ liệu truyền thống (Nguồn: Internet)

Tóm lại, quản trị dữ liệu trong hệ thống điện tử đã phát triển đến mức tới hạn, đóng góp quan trọng đến mọi hoạt động của xã hội. Dù vậy, do “vun đắp” từ những dữ liệu có nguồn gốc ban đầu đã có khiếm khuyết (không đầy đủ, không chính xác, không kịp thời) nên tất cả các biện pháp được áp dụng để quản trị dữ liệu đều không phát huy được hết khả năng của mình và không kiến tạo được nguồn tài nguyên dữ liệu thực sự hoàn hảo phục vụ cho nhu cầu phát triển của xã hội. Như thế, vấn đề gốc rễ là phải thay đổi phương pháp thu thập dữ liệu.

Đặc điểm của quản trị dữ liệu trong hệ thống số

Như trên đã phân tích, làm thế nào thu thập được dữ liệu đầy đủ, chính xác, kịp thời là gốc của vấn đề. Dễ dàng luận ra rằng cần có giải pháp thay thế con người thu thập dữ liệu. IoT ra đời trong bối cảnh đó. IoT (Internet of Things) là các thiết bị kết nối vạn vật vào Internet, hay rõ hơn, IoT là thiết bị dùng để đo lường giá trị thuộc tính của từng thực thể trong quá trình vận động của nó và gửi vào kho lưu trữ trong không gian số (cyber). Tập hợp các dữ liệu thuộc tính của một thực thể trên cyber tạo thành phiên bản số hay song sinh số (digital twin) của thực thể đó. Những thay đổi có tính gốc rễ này dẫn tới cách thức quản trị dữ liệu trong hệ thống số hoàn toàn khác.  

Nguồn gốc dữ liệu: Do IoT thu thập. Vì IoT thu thập dữ liệu tự động, độc lập với con người, nên tiêu chuẩn đặt ra cho mục tiêu thu thập được dữ liệu đầy đủ, chính xác và kịp thời (theo thời gian thực) là chọn loại IoT gì? để thu thập dữ liệu nào? cho thực thể nào? với những yêu cầu cụ thể nào? Bên cạnh đó cần quản trị các IoT như thế nào để có thể yên tâm chúng đủ năng lực và hoạt động tin cậy khi số lượng IoT lên đến hàng ngàn (đối với một doanh nghiệp) hay hàng tỷ (đối với bộ máy chính phủ) cũng là một nhiệm vụ quan trọng. 

Phương pháp tổ chức và xử lý dữ liệu: Nếu như trong hệ thống điện tử, dữ liệu được tổ chức trong các files có cấu trúc để cung cấp cho các phần mềm xử lý theo chức năng (dữ liệu phụ thuộc vào yêu cầu xử lý) thì trong hệ thống số, dữ liệu được tổ chức theo thực thể: Mỗi thực thể có ID riêng và tất cả các giá trị thuộc tính của nó đều gắn với ID đó. Nhiệm vụ đặt ra là cần thu thập được đầy đủ các dữ liệu phản ánh khách quan về trạng thái vận động của thực thể trong thế giới thực. Nói cách khác là cần thiết lập được song sinh số (digital twin) cho từng thực thể. Tổ chức dữ liệu trong hệ thống số là việc thiết lập hệ thống digital twin của các tập thực thể kết nối với nhau theo những nguyên tắc được xác định. Ví dụ với thực thể “Người dân”, digital twin bao gồm tất cả các dữ liệu cá nhân về tư pháp, học tập, công việc, thu nhập, sức khỏe, bảo hiểm, trách nhiệm công dân, quan hệ xã hội, sở hữu tài sản,… của từng người dân. Tất cả các cơ quan có chức năng quản lý người dân đều xử lý trên các tập dữ liệu liên quan của bản song sinh số này (dữ liệu độc lập với yêu cầu xử lý). Hơn nữa, dữ liệu do IoT thu thập theo thời gian thực và có khối lượng rất lớn nên cần tới cơ chế xử lý dữ liệu theo luồng (stream processing) dựa trên AI. Vì thế, những tiêu chuẩn, quy định, cơ chế quản trị dữ liệu trong tổ chức và xử lý dữ liệu trong hệ thống số hoàn toàn khác so với hệ thống điện tử: Tổ chức dữ liệu theo thực thể trong hệ thống phi tập trung thống nhất, xử lý dữ liệu bằng AI và các quy trình dựa trên AI.

Phương pháp tổ chức dữ liệu số kéo theo những thay đổi to lớn trong tất cả các ngành, lĩnh vực. Ví dụ phát triển học liệu số – nội dung trọng tâm trong xây dựng đại học số – hướng tới mô hình kết nối các module tri thức theo các mối quan hệ logic biện chứng giúp công tác dạy và học trở nên dễ dàng hơn, mở hơn (không giới hạn), học sinh có thể học bất cứ học phần nào, bất cứ ở đâu và bất cứ khi nào. Hình ảnh tương tự cũng diễn ra trong lĩnh vực lưu trữ: Lưu trữ số (digital archivement) không còn hình ảnh buồn tẻ của lưu trữ truyền thống mang tính chất bảo quản mà trở nên sinh động với khả năng cho phép khai phá nguồn tài nguyên quý giá được lưu trữ, đặc biệt là với sự hỗ trợ của AI.

Quản trị dữ liệu trong bối cảnh xây dựng chính phủ số - đặc điểm và cơ hội - datta2

Mối liên kết giữa các thực thể (Nguồn: Internet)

Quản trị chia sẻ dữ liệu: Dữ liệu được tổ chức độc lập với yêu cầu xử lý và không do một cơ quan hay bộ phận tự tạo ra một cách độc lập (mặc dù có đóng góp cho sự hoàn thiện digital twin của thực thể). Vì thế, trong hệ thống số (chính phủ số, doanh nghiệp số, đại học số,…) không có khái niệm “chia sẻ dữ liệu” mà chỉ có khái niệm “phân bổ dữ liệu” hay “quyền truy cập kho dữ liệu”. Hơn nữa, các cơ chế xử lý được áp dụng trong hệ thống số là xử lý thông minh (do con người huấn luyện cho AI thực hiện) nên các quy định, nguyên tắc được áp dụng không chỉ mang tính pháp lý đối với con người mà còn là các ràng buộc kỹ thuật được tuân thủ nghiêm ngặt.

Bảo vệ an toàn dữ liệu: Với khối lượng dữ liệu rất lớn do IoT thu thập và xử lý dựa trên AI, nhiệm vụ bảo vệ an toàn được nâng lên cấp độ kỹ thuật: Hệ thống tự bảo vệ. Các chuyên gia sáng tạo ra các cơ chế bảo vệ an toàn và huấn luyện cho hệ thống tự động thực hiện các biện pháp giám sát, phát hiện rủi ro, nguy cơ mất an toàn và tự động xử lý bảo vệ an toàn dữ liệu theo hướng tối ưu hóa, tiến tới cơ chế bảo vệ an toàn thông minh khi hệ thống tự chọn được phương án an toàn nhất cho từng trường hợp cụ thể. Đây là điểm khác biệt hoàn toàn so với cách làm truyền thống.

Bước chuyển từ quản trị dữ liệu trong hệ thống điện tử sang quản trị dữ liệu trong hệ thống số

Chuyển đổi số là quá trình diễn ra dần dần, không thể thành công ngay trong một thời gian ngắn. Trong quá trình đó tất cả các thành phần của hệ thống từng bước chuyển đổi, quản trị dữ liệu nằm ở vị trí trung tâm.

Trong giai đoạn đầu, người ta chứng kiến quá trình “hòa nhập” dần dần giữa dữ liệu văn bản (text data) được số hóa với dữ liệu số (digital data) được thu thập bằng IoT. Lượng dữ liệu văn bản chiếm tỷ trọng vượt trội lúc đầu dần nhường chỗ cho dữ liệu số, tiến tới đảo chiều hoàn toàn, dữ liệu số chiếm tỷ trọng tuyệt đối. Quá trình chuyển từ quản trị dữ liệu truyền thống sang quản trị dữ liệu số cũng diễn ra theo tiến trình đó theo hướng tăng dần mức hoàn thiện. Ở đây, kiến trúc dữ liệu đóng vai trò quyết định.

Quản trị dữ liệu trong bối cảnh xây dựng chính phủ số - đặc điểm và cơ hội - data3

Kiến trúc dữ liệu của hệ thống số (Nguồn: Microsoft)

Hiện nay, các giải pháp công nghệ tiên tiến áp dụng cho các nhiệm vụ thu thập dữ liệu bằng IoT, quản trị IoT bằng hệ điều hành dành riêng (IoT OS) như các devices, hướng dẫn AI lập trình bằng ngôn ngữ tự nhiên, phát triển các quy trình thông minh dựa trên AI hành động (AI in action),… đã hội đủ. Vì vậy, bài toán phát triển hệ thống quản trị dữ liệu số tiên tiến hoàn toàn khả thi và cũng là cơ hội đẩy nhanh quá trình chuyển đổi số ở nước ta. 

Kết luận

Phân tích trên cho thấy mọi việc thay đổi khi tách con người ra khỏi nhiệm vụ thu thập dữ liệu và giao việc đó cho máy móc thiết bị (IoT). Chính việc tạo ra nguồn dữ liệu số một cách độc lập này tạo ra khả năng ứng dụng hàng loạt công nghệ số tiên tiến (IoT, Cloud, AI,…) phục vụ mọi hoạt động phát triển của xã hội và kết quả thu được cao hơn nhiều so với cách làm truyền thống. Như thế, thực chất của chuyển đổi số là quá trình chuyển từ phương thức hoạt động hiện nay sang phương thức hoạt động mới nơi các công nghệ số phát huy mạnh mẽ sức mạnh của chúng phục vụ mọi mặt phát triển kinh tế, xã hội.

Trong quá trình chuyển đổi đó, dữ liệu nằm ở vị trí trung tâm, là nguồn tài nguyên quý giá nhất. Vì thế quản trị dữ liệu có vai trò đặc biệt quan trọng. Nó quyết định năng lực ra quyết định dựa trên dữ liệu (data driven decision) của mọi tổ chức và doanh nghiệp.

Có thể bạn quan tâm
MoMo tạo bộ giải pháp tài chính toàn diện cho tiểu thương Việt

Bộ giải pháp số hoá toàn diện cua MoMo, với lộ trình 3 bước cụ thể, dễ áp dụng và sát với thực tế vận hành của các hộ kinh doanh cá thể và tạp hoá truyền thống.

Ngành Xây dựng đang trở thành mục tiêu mã độc tấn công hàng đầu

Dữ liệu mới nhất của Kaspersky vào Quý 1 năm 2025 cho thấy, các vụ tấn công vào máy tính được sử dụng trong hệ thống điều khiển công nghiệp (ICS) tại các công trình xây dựng và nhà máy đang gia tăng, đặc biệt khu vực Đông Nam Á.

Google mở gói Flow và Google AI Ultra cho thị trường Việt

Flow, công cụ AI dành cho các nhà làm phim kể từ khi ra mắt tại sự kiện I/O toàn cầu vào tháng 5 vừa rồi là một trong những gói dịch vụ mà người dùng Việt chờ đón.

Bosch Rexroth và Trung tâm Đổi mới sáng tạo Công nghiệp 4.0 (IIC) hợp tác kiến tạo nền tảng cho Nhà máy thông minh

Ngày 9/7/2025, Bosch Rexroth Việt Nam phối hợp cùng Trung tâm đổi mới Sáng tạo Công nghiệp (IIC) tổ chức buổi hội thảo “ctrlX AUTOMATION & Kassow Robots – Nền tảng vững chắc cho Nhà máy thông minh” tại Trường Đại học Quốc tế Miền Đông (EIU), nhằm thúc đẩy ứng dụng tự động hóa, chuyển đổi số và phát triển nguồn nhân lực, góp phần xây dựng nền tảng bền vững cho Công nghiệp 4.0 tại Việt Nam.

Nguy hiểm cao khi dữ liệu cơ quan chính phủ và bệnh viện là mục tiêu của mã độc tống tiền

Chính phủ Thụy Sĩ xác nhận một lượng lớn dữ liệu nhạy cảm của các văn phòng liên bang của chính phủ đã bị đánh cắp trong một cuộc tấn công bằng mã độc tống tiền (ransomware). Vụ việc một lần nữa dấy lên hồi chuông cảnh báo về loại mã độc nguy hiểm cho mọi nhóm ngành lĩnh vực.

Zebra nhận giải thưởng Nhà cung cấp xuất sắc cho ngành bưu chính Hoa Kỳ

Ngày 9/7, Zebra – nhà cung cấp các giải pháp số hoá và tự động hoá quy trình làm việc công bố vừa được Cơ quan Bưu chính Hoa Kỳ (USPS) vinh danh Nhà cung cấp xuất sắc (Supplier Performance Award).

AWS công bố loạt tính năng bảo mật quan trọng giúp khách hàng đơn giản hóa và mở rộng quy mô trong kỷ nguyên AI tạo sinh

Amazon Web Services (AWS) vừa công bố loạt tính năng bảo mật mới tại sự kiện AWS re:Inforce 2025 (Philadelphia), nhằm giúp các khách hàng tăng cường năng lực an ninh bảo mật số.

VNPT triển khai 3 phần mềm chuyển đổi số trọng yếu cho Bộ Ngoại giao 

Ngày 4/7/2025, Bộ Ngoại giao chính thức khai trương ba hệ thống quan trọng: Cổng Thông tin điện tử Bộ Ngoại giao, Hệ thống Quản lý Văn bản và Điều hành, cùng Nền tảng tích hợp chia sẻ dữ liệu cấp Bộ (LGSP). Đây là những “mắt xích số” quan trọng do VNPT phát triển.

Hệ thống thuế cập nhật theo mô hình 2 cấp đảm bảo không gián đoạn cho người dân, doanh nghiệp

Từ ngày 1/7/2025, ngành Thuế vận hành mô hình tổ chức theo chính quyền địa phương hai cấp (tỉnh – xã) và áp dụng mã định danh cá nhân thay thế mã số thuế. Đây là hai trụ cột cải cách lớn trong tiến trình xây dựng Chính phủ điện tử và nền tài chính số quốc gia.

Du khách Việt “Quét QR quốc tế” thoải mái ở Singapore với Zalopay

Zalopay chính thức ký kết hợp tác với Tổng cục Du lịch Singapore (Singapore Tourism Board – STB) về mở rộng phạm vi tính năng “Quét QR quốc tế” trên ứng dụng Zalopay, nay cho phép người dùng thanh toán trực tiếp tại Singapore thông qua mạng lưới đối tác của Singapore Tourism Board.