Dòng chảy
CSDL quốc gia, 30 năm vẫn chưa xây dựng xong
Từ đầu thập niên 1990, khái niệm về các CSDL quốc gia đã được Việt Nam đề cập. Tuy vậy, đến cuối thập niên đó, một số CSDL quy mô quốc gia đầu tiên mới được khởi công xây dựng. Vào cuộc, nhiều người tưởng dễ, có thể làm nhanh, nhưng thực tế cho thấy có rất nhiều yếu tố tác động làm cho quá trình xây dựng bị kéo dài, thậm chí có những CSDL mãi đến ngày nay, sau gần 30 năm vẫn chưa xong.

Một vài CSDL quốc gia được đánh giá gần như hoàn thành hiện nay gồm CSDL về thống kê tổng hợp hay đất đai, số còn lại đang xây dựng, có cái chỉ mới bắt đầu.

Nhìn vào phương pháp thiết kế và cấu trúc dữ liệu của các CSDL quốc gia của Việt Nam, nhiều người có chung những nhận xét rằng: Các CSDL này đều áp dụng chung phương pháp thiết kế truyền thống từ vài chục năm trước; Nguồn dữ liệu chính tạo nên các CSDL này đều dựa trên kết quả của các cuộc điều tra hay số liệu thống kê; Các CSDL này đều có số lượng thuộc tính hạn chế (ví dụ đối với CSDL quốc gia về dân cư, con số này là 17) và đều là các thuộc tính tĩnh (chứa những giá trị cố định).

Ngày nay, trong kỷ nguyên số, nhiều phương pháp đã thay đổi, nhiều cơ hội mới xuất hiện giúp chúng ta có thể xây dựng những CSDL quốc gia nhanh hơn, hoàn thiện hơn. Bài viết này sẽ đề cập tới một góc nhỏ của hướng phát triển quan trọng này.

Tận dụng công nghệ số giúp thu thập dữ liệu nhanh chóng

Cuộc cách mạng công nghiệp lần thứ tư (CMCN 4) hay cuộc cách mạng về công nghệ số mang đến nhiều điều mới mẻ, có khi là đảo ngược, tỷ như trước đây chúng ta quan niệm CNTT là phương tiện hỗ trợ, ngày nay nó trở thành một cấu phần của hệ thống, một bản chất của xã hội. 

Mọi nỗ lực của con người cuối cùng cũng hướng về một mục tiêu: làm thế nào hiểu được thế giới xung quanh, cụ thể hơn là hiểu về các thực thể tạo ra thế giới đó. Trước đây, do hạn chế về công nghệ, người ta chỉ hiểu được các thực thể thông qua các dữ liệu ít ỏi thu thập được về thực thể đó, phần lớn là bằng cảm nhận chủ quan của con người. Vì vậy, gần như tất cả dữ liệu thu thập được đều mang tính thống kê và là những dữ liệu tĩnh. Cuộc sống luôn phát triển, mọi thực thể đều trong quá trình vận động không ngừng. Vì vậy, từ lâu người ta đã ao ước thu thập được các dữ liệu phản ánh trạng thái vận động của thực thể, những dữ liệu động. 

Bước vào kỷ nguyên số, điều mơ ước đó trở thành sự thật: Nhờ các thiết bị đo, các camera (gọi chung là thiết bị IoT) người ta có thể thu thập được những dữ liệu phản ánh trạng thái vận động của thực thế và gặt hái được những kết quả ngoài mong đợi. Ví dụ, ở Trung Quốc, Tây Ban Nha,… người ta lắp hàng trăm triệu camera khắp cả nước để thu thập dữ liệu về người dân. Lúc đầu chỉ nhằm mục đích hỗ trợ an ninh, dần dần người ta nhận ra những hình ảnh động thu được còn phục vụ được cho nhiều mục đích khác. Vì thông qua đó, có thể nhận dạng được khuôn mặt, ngoại hình, hành vi,… phản ánh những thông tin giá trị về xã hội học như người dân có hạnh phúc không, có vui vẻ không (qua nét mặt), có văn hóa, lịch sự không (qua hành vi), có giàu có không (qua trang phục),… và cả xu hướng thời trang theo mùa nữa. Việc cập nhật và lưu trữ khối lượng lớn những dữ liệu này cho phép xác định và phát hiện những quy luật, diễn biến trong thực tế. 

Như thế, với IoT, AI. Big data,… lượng dữ liệu phản ánh về các thực thể trong xã hội trở nên đầy đủ hơn rất nhiều so với trước đây. Và dựa trên khối lượng dữ liệu đó, người ta có thể phân tích, dự báo và triển khai nhiều giải pháp mới mẻ để phục vụ xã hội trong mọi lĩnh vực: phát triển kinh tế, nâng cao chất lượng của đời sống xã hội, an sinh xã hội,….

Những năng lực mới này không còn là khả năng mà là hiện thực. Câu hỏi đặt ra là, vậy những CSDL quốc gia đã và đang xây dựng cần chuyển đổi như thế nào để nhanh chóng tiếp cận và phát huy được những ưu việt của công nghệ số đang làm thay đổi cả thế giới? Chắc chắn là chúng ta cần thay đổi ngay từ bây giờ chứ không phải “làm xong (theo cách cũ) rồi hãy tính”.

Làm thế nào để gắn kết, kế thừa những dữ liệu tĩnh đã được thu thập với những dữ liệu động của cùng một thực thể, ví dụ với người dân hay doanh nghiệp? Vấn đề không chỉ nằm dưới góc độ kỹ thuật mà quan trọng hơn là về mặt  tổ chức và nhận thức. Ai cũng biết dữ liệu chỉ có ý nghĩa nếu nó được xử lý, cập nhật và sử dụng. Như vậy, nơi phù hợp nhất để thi triển những đặc tính đó là trong môi trường mà thực thể tồn tại và vận động. Điều này phù hợp với nguyên lý xây dựng tháp thông tin với những thông tin mang tính tác nghiệp nằm ở đáy và thông tin mang tính chiến lược nằm ở đỉnh. Nói cách khác, dữ liệu “sống” về các thực thể trong xã hội nằm ở các địa phương chứ không phải ở các bộ, ngành. Việc tổ chức tốt, đầy đủ và thường xuyên cập nhật dữ liệu ở cấp địa phương là nền tảng để các bộ, ngành trung ương tổng hợp, xử lý làm căn cứ tham mưu cho chính phủ những quyết sách kịp thời và khoa học cả ở mức chiến lược lẫn chiến thuật. Hơn nữa, việc sử dụng chung cùng một nguồn dữ liệu thống nhất giúp các kết quả xử lý ở các bộ ngành nhất quán với nhau dù áp dụng những tiêu chí và quy trình xử lý khác nhau.

Bắt đầu từ hạt nhân của các CSDL quốc gia

Như thế, quá trình chuyển đổi các CSDL quốc gia từ dạng tĩnh sang dạng động cần bắt đầu từ các địa phương và gắn trực tiếp với các hoạt động quản lý nhà nước đối với các thực thể là đối tượng quản lý ở các địa phương, trước tiên là người dân, doanh nghiệp và tài nguyên. Ở đây cần một cầu nối để các hoạt động QLNN mang tính chuyên ngành “hiểu” được nhau, để từ đó, có thể chia sẻ, phối hợp một cách hiệu quả nhất. Cầu nối đó, ở Tp Hồ Chí Minh, là “Kho dữ liệu dùng chung”. Theo đó, tất cả các cơ quan chức năng của bộ máy nhà nước khi xử lý dữ liệu về một lớp thực thể nào đó sẽ đều sử dụng chung những thuộc tính cơ bản nhất của lớp thực thể được tập hợp và chia sẻ trong kho dữ liệu dùng chung. Về mặt kỹ thuật, các thuộc tính khóa của thực thể được quản lý, là “đầu mối” kết nối tất cả các dữ liệu liên quan đến thực thể này dù ở bất cứ dạng nào (có cấu trúc, không có cấu trúc hay kết hợp). Đây chính là hạt nhân của các CSDL quốc gia.

Để minh họa tính ưu việt của công nghệ số trong tổ chức và khai thác CSDL về đất đai, chúng ta có thể lấy ví dụ cụ thể về đất nông nghiệp. Trước đây, CSDL về đất nông nghiệp được xây dựng chủ yếu dựa trên số liệu điều tra về nông hóa thổ nhưỡng. Những dữ liệu đó, từ ngày được lập rất ít được sử dụng, đơn giản bởi vì chúng mang tính hỗ trợ tham khảo hơn là chỗ dựa để hoạch định chiến lược. Trong thực tế, dữ liệu về đất nông nghiệp luôn biến thiên, không chỉ là ở diện tích mà còn ở nhiều khía cạnh khác quyết định đến lựa chọn phương án canh tác như độ pH, độ nhiễm mặn, nhiễm phèn, nhiễm kim loại nặng, hàm lượng dinh dưỡng trong đất,… Sau nhiều chục năm sử dụng hóa chất một cách thiếu kiểm soát, chất lượng đất nông nghiệp không còn như hồi cách đây 30 – 40 năm.

Theo đó, mục tiêu đặt ra trước khi “làm mới” CSDL đất nông nghiệp là cần xác định rõ các thuộc tính của từng khu vườn, từng mảnh ruộng để từ đó chọn lựa giải pháp cải tạo đất, làm cho đất khỏe. Ngày trước, yêu cầu đặt ra này rất khó, không thể thực hiện. Nhưng ngày nay, công nghệ số giúp chúng ta giải bài toán này một cách dễ dàng. Sử dụng các thiết bị IoT, người ta dễ dàng đo được các thông số kỹ thuật của từng khu vườn, từng mảnh ruộng với chi phí không đáng kể. Như thế, nếu lập một bản đồ số về đất nông nghiệp của một địa phương và cập nhật những dữ liệu trạng thái này lên bản đồ cho từng khu vườn hay mảnh ruộng, thì chỉ sau vài vụ là đã có được một bản đồ số đầy đủ và tuyệt vời về nguồn tài nguyên quý giá, không chỉ với những thuộc tính tĩnh (như số thửa, diện tích,…) mà quan trọng hơn còn có những thuộc tính động từ chất lượng đất đến sản phẩm được canh tác, quy trình canh tác,… Tập hợp của các bản đồ số đất trồng trọt của tất cả các địa phương, hiển nhiên cho chúng ta cách nhìn khác về CSDL quốc gia về đất đai và cách thức xây dựng, cập nhật, khai thác nó.

Nghị quyết 52 – NQ/TW của Bộ Chính trị ban hành ngày 27/9/2019 có nội dung trọng tâm là xây dựng và phát triển nền kinh tế số. Nền kinh tế đó dựa vào hạ tầng số quốc gia mà hạ tầng đó lấy các CSDL quốc gia làm nền tảng. Vì vậy hơn lúc nào hết, chúng ta cần góp sức nhanh chóng xây dựng các CSDL quốc gia này theo đúng tinh thần của thời đại công nghệ số chứ không phải theo những quan niệm mà chúng ta đã quen khi thiết kế các CSDL này từ nhiều trước.

Chuyên gia Nguyễn Tuấn Hoa

 

Gửi bình luận
Có thể bạn quan tâm
Dòng chảy
Quyết hạ Huawei đến cùng, FCC tung quỹ 5G cực khủng hỗ trợ nông thôn Mỹ

FCC vừa công bố 5G Fund trị giá 9 tỷ USD để hỗ trợ đưa kết nối tốc độ cao đến khu vực nông thôn Mỹ, trong đó ít nhất 1 tỷ USD sẽ được dành cho việc áp dụng 5G trong nông nghiệp. Điều này sẽ khiến các nhà cung cấp dịch vụ ở nông thôn dễ quay lưng với thiết bị mạng từ Huawei.

Samsung sẽ đóng chip cũ của Note 9 lên Note 10 Lite và bán giá cắt cổ?

Các tin đồn cho thấy nhiều khả năng Samsung sẽ trang bị cho Galaxy Note 10 Lite con chip Exynos 9810 của năm 2018.

iPhone 11 Pro vẫn thu thập dữ liệu vị trí bất chấp cài đặt của người dùng

Nhà nghiên cứu bảo mật tại KrebsOnSecurity đã phát hiện ra một lỗ hổng tồn tại trong chiếc điện thoại cao cấp mới nhất của Apple nhằm mục đích thu thập dữ liệu vị trí người dùng.

Vi xử lý Snapdragon 865 hỗ trợ camera có độ phân giải lên đến 200 MP

Snapdragon 865 là chip di động cao cấp mới nhất mà Qualcomm vừa ra mắt nhằm hướng đến đại đa số smartphone cao cấp của năm 2020.