Khung thống kê không gian địa lý toàn cầu và khả năng áp dụng tại Việt Nam
Bối cảnh
Chương trình Nghị sự 2030 về Phát triển bền vững, với 17 mục tiêu phát triển bền vững (SDG), giúp giám sát ba trụ cột phát triển của mỗi quốc gia gồm Kinh tế, Xã hội và Môi trường. Việc tích hợp thông tin từ lĩnh vực thống kê (bao gồm nhiều loại dữ liệu kinh tế - xã hội và doanh nghiệp) và không gian địa lý (bao gồm dữ liệu quan sát trái đất và môi trường) được cộng đồng quốc tế công nhận là một công cụ quan trọng để hiểu rõ mối quan hệ giữa ba trụ cột này cũng như trong bản thân nội bộ từng trụ cột; cải thiện chất lượng ra quyết định dựa trên bằng chứng tại các quốc gia.
Ghi nhận tầm quan trọng của việc tích hợp thông tin thống kê với không gian địa lý, Ủy ban Thống kê Liên Hợp Quốc đã thông qua khung thống kê không gian địa lý toàn cầu (khung GSGF) tại kỳ họp lần thứ 51 vào tháng 3/2020 theo Quyết định số 51/123.
Khung GSGF cho phép tích hợp dữ liệu từ cộng đồng thống kê và không gian địa lý thông qua việc áp dụng các nguyên tắc cụ thể. Dữ liệu tích hợp này là nền tảng để cung cấp dữ liệu chất lượng cao, có thể truy cập, đảm bảo tính kịp thời, đáng tin cậy và được phân tổ theo các nhóm thu nhập, giới tính, tuổi tác, chủng tộc, dân tộc, tình trạng di cư, tình trạng khuyết tật, vị trí địa lý, cũng như được phân tổ theo các đặc điểm phù hợp với bối cảnh của mỗi quốc gia. Từ khi được ban hành đến nay, khung GSGF đã được thực hiện bởi các cơ quan thống kê quốc gia và các cơ quan thông tin không gian địa lý ở 29 quốc gia thành viên của Liên Hợp Quốc.
Trong các năm 2020-2022, khi đại dịch Covid-19 xuất hiện và diễn biến phức tạp, ảnh hưởng lớn đến các hoạt động thống kê, khung GSGF đã hỗ trợ đắc lực các quốc gia trong ứng phó với đại dịch Covid-19, thông qua cung cấp thông tin theo không gian địa lý kịp thời hơn, theo phân tổ chi tiết hơn, giúp các chính phủ xây dựng và thực hiện các chính sách khác nhau trong đại dịch.
Khung thống kê không gian địa lý toàn cầu
Về khái niệm, Liên Hợp Quốc (2019) định nghĩa khung GSGF là khung giúp tích hợp và sản xuất thông tin thống kê địa lý một cách nhất quán. Khung GSGF cung cấp một phương pháp chung để tích hợp dữ liệu thống kê và dữ liệu hành chính theo không gian địa lý nhằm đảm bảo tích hợp dữ liệu từ nhiều nguồn khác nhau dựa trên vị trí, cũng như đảm bảo có thể tích hợp những dữ liệu này với các thông tin không gian địa lý khác.
Khung GSGF là cầu nối giữa khung thống kê và khung thông tin không gian địa lý, giữa cơ quan thống kê quốc gia (CQTKQG) với cơ quan bản đồ và không gian địa lý quốc gia cũng như giữa các tiêu chuẩn, phương pháp, quy trình, công cụ thống kê và không gian địa lý. Khung cung cấp cho cộng đồng quốc tế một cách tiếp cận chung để kết nối dữ liệu kinh tế, xã hội và môi trường thông qua vị trí; đồng thời cải thiện khả năng tiếp cận và sử dụng dữ liệu theo không gian địa lý. Khung cũng cung cấp cơ chế kết nối thông tin thống kê với các nỗ lực cải thiện việc quản lý thông tin không gian địa lý trên toàn cầu, khu vực và quốc gia.
Khung GSGF gồm những phần chính sau: (i) Dữ liệu đầu vào; (ii) Các nguyên tắc; (iii) Các thành tố chính; và (iv) Đầu ra. Cụ thể được minh họa tại Hình 1.
Hình 1. Khung thống kê không gian địa lý toàn cầu
Nguồn: Liên Hợp Quốc (2019)
Theo đó, khung GSGF bắt đầu với các đầu vào quan trọng của dữ liệu không gian địa lý cơ bản, cùng với các nguồn dữ liệu không gian địa lý khác do cơ quan bản đồ và không gian địa lý quốc gia cũng như cộng đồng không gian địa lý cung cấp. Khung GSGF nhằm giúp tạo ra dữ liệu thống kê truyền thống, dữ liệu hành chính và các nguồn dữ liệu khác theo không gian, trong đó phần lớn dữ liệu đến từ cơ quan thống kê quốc gia và các cơ quan sở hữu dữ liệu trong hệ thống thống kê quốc gia. Mỗi đầu vào này có thể được tăng cường bằng các bộ dữ liệu bổ sung, chẳng hạn như các bộ dữ liệu có nguồn gốc từ cộng đồng, hoặc từ các nguồn dữ liệu mới như dữ liệu lớn.
Phần tiếp theo của khung GSGF là năm nguyên tắc hoạt động, gồm: (i) Nguyên tắc 1: Sử dụng cơ sở hạ tầng không gian địa lý cơ bản và mã hóa địa lý; (ii) Nguyên tắc 2: Mã hóa địa lý dữ liệu vi mô trong môi trường quản lý dữ liệu; (iii) Nguyên tắc 3: Xây dựng các khu vực địa lý chung để phổ biến số liệu thống kê; (iv) Nguyên tắc 4: Tương tác giữa thống kê và không gian địa lý; và (v) Nguyên tắc 5: Tiếp cận và sử dụng số liệu thống kê theo không gian địa lý. Theo đó, khung đưa ra các quy trình để áp dụng các cơ sở hạ tầng và quy trình thống kê và không gian địa lý đối với dữ liệu đầu vào nhằm tích hợp hai nguồn thông tin. Trước hết, dữ liệu thống kê được tích hợp theo không gian địa lý ở mức tốt nhất có thể. Sau đó, sử dụng các công cụ không gian địa lý và các phương pháp, chẳng hạn như khu vực địa lý chung và các tiêu chuẩn chung về thực hành tốt để đảm bảo dữ liệu có thể tương tác, truy cập và sử dụng được. Năm nguyên tắc này hướng dẫn các quốc gia cách xây dựng và hoàn thiện các quy trình để sản xuất dữ liệu thống kê và dữ liệu hành chính theo không gian địa lý, giúp xác định những khoảng trống về năng lực thống kê và cơ sở hạ tầng không gian địa lý quốc gia. Năm nguyên tắc được xem là phần cốt lõi của khung GSGF và các nguyên tắc đều có mối quan hệ chặt chẽ với nhau nên khung GSGF không thể thiếu bất kỳ nguyên tắc nào.
Các thành tố chính gồm bốn thành tố bao trùm tất cả năm nguyên tắc hoạt động của khung GSGF nhằm thu được dữ liệu từ nhiều nguồn khác nhau cũng như giúp áp dụng năm nguyên tắc nói trên, gồm: (i) Các tiêu chuẩn và thực hành tốt; (ii) Luật và các chính sách quốc gia; (iii) Cơ sở hạ tầng kỹ thuật; và (iv) Hợp tác. Trong đó, các tiêu chuẩn và thực hành tốt được áp dụng cho cộng đồng không gian địa lý và thống kê, có thể mở rộng sang cả công nghệ thông tin và các lĩnh vực khác và bao gồm các tiêu chuẩn thống kê chính thức (như bảng phân loại, khái niệm, định nghĩa), các tiêu chuẩn khác (như tiêu chuẩn ISO), các hướng dẫn/ phương pháp thực hành tốt (như OGC, ISO và W3C, thực tiễn tốt nhất) và các tiêu chuẩn thực tiễn khác được sử dụng rộng rãi trong cộng đồng không gian địa lý (như GeoJSON). Luật và các chính sách quốc gia gồm các văn bản luật liên quan đến bảo vệ dữ liệu quốc gia và quốc tế, bảo vệ quyền riêng tư và bảo mật, các yêu cầu về đạo đức, chính sách dữ liệu mở và các thỏa thuận về truy cập dữ liệu. Cơ sở hạ tầng kỹ thuật gồm năng lực chuyên môn ở cấp quốc gia và khu vực, như kỹ năng của nguồn nhân lực, các phương pháp và quy trình đã được xây dựng và thống nhất, cơ sở hạ tầng hệ thống và cũng có thể bao gồm hệ thống quản lý dữ liệu, cơ sở hạ tầng máy tính và truyền thông. Cuối cùng hợp tác là cam kết hợp tác giữa các cơ quan, tổ chức, đặc biệt là giữa các cơ quan thống kê, cơ quan không gian địa lý và cơ quan hành chính của nhà nước. Hợp tác dưới các hình thức như ký kết các thỏa thuận hợp tác và/hoặc tạo lập các mối quan hệ hợp tác chặt chẽ giữa các cơ quan, tổ chức.
Đầu ra của khung GSGF là kết quả của các quy trình của khung GSGF. Dữ liệu đầu ra có mức độ hài hòa và chuẩn hóa cấu trúc cao hơn, cũng như tính linh hoạt về không gian địa lý. Các kết quả đầu ra của khung GSGF giúp truy cập vào dữ liệu tương tác giữa kinh tế-xã hội với không gian địa lý. Dữ liệu này có thể được sử dụng hiệu quả trên nhiều lĩnh vực nhằm hỗ trợ các ưu tiên cấp quốc gia và cấp toàn cầu.
Kết quả đầu ra của khung GSGF có khả năng tích hợp cao hơn dựa trên vị trí và có thể được tiếp tục sử dụng trong các quy trình tích hợp dữ liệu thống kê phức tạp hơn. Một đặc điểm quan trọng của kết quả đầu ra của khung GSGF là các đầu ra mang lại độ tin cậy cao hơn trong việc tạo ra các kết quả có thể tái tạo theo con người và theo thời gian. Quan trọng hơn cả, các kết quả đầu ra của khung GSGF giúp đưa ra các phân tích hiệu quả nhằm hỗ trợ việc ra quyết định.
Dữ liệu thống kê và không gian địa lý được sử dụng để tạo số liệu thống kê theo không gian địa lý cần tuân thủ quy định về quyền riêng tư và bảo mật khi công bố.
Vai trò của khung thống kê không gian địa lý toàn cầu
Khung GSGF được xây dựng nhằm giải quyết chín vấn đề cơ bản sau: (i) Tích hợp dữ liệu để hỗ trợ đo lường và giám sát các mục tiêu và khung SDG toàn cầu của Chương trình nghị sự 2030 đảm bảo phát triển bền vững và vòng Tổng điều tra dân số và nhà ở năm 2020; (ii) Giúp so sánh dữ liệu ở cấp địa phương, cấp tỉnh, cấp quốc gia, cấp khu vực và cấp toàn cầu, phục vụ quá trình ra quyết định trong nội bộ mỗi quốc gia và giữa các quốc gia cũng như trong các lĩnh vực chuyên đề khác nhau; (iii) Chia sẻ dữ liệu giữa các cơ quan, tổ chức thông qua tích hợp thông tin thống kê với thông tin không gian địa lý, hỗ trợ xây dựng các công cụ và các ứng dụng chung; (iv) Giúp nắm bắt những thông tin chi tiết mới và các mối quan hệ dữ liệu trước đây không thể thực hiện được nếu phân tích dữ liệu kinh tế - xã hội, môi trường hoặc dữ liệu không gian địa lý một cách riêng biệt; (v) Tăng thông tin về các khu vực địa lý nhỏ; (vi) Nâng cao nhận thức về các phương pháp và công cụ để đánh giá và quản lý rủi ro bảo mật thông tin cũng như tăng cường đảm bảo quyền riêng tư trong công tác thu thập, lưu trữ và phổ biến thông tin; (vii) Tạo điều kiện để đầu tư và nâng cao năng lực về thông tin thống kê và không gian địa lý; (viii) Giúp tích hợp các nguồn dữ liệu mới để phục vụ quá trình sản xuất thông tin không gian địa lý chất lượng cao, ví dụ như quan sát trái đất và các nguồn dữ liệu bổ sung khác; (ix) Tăng cường hợp tác thể chế giữa cộng đồng các nhà khoa học không gian địa lý và thống kê.
Khả năng áp dụng tại Việt Nam
Tổng quan thực tiễn áp dụng thống kê không gian địa lý cho thấy tại Việt Nam, một số nghiên cứu liên quan đến việc khai thác dữ liệu thống kê trên nền thông tin địa lý đã dần được triển khai ở các bộ, ngành và TCTK. Bên cạnh đó, Việt Nam cũng đã có các chủ trương, chính sách làm cơ sở để thực hiện tích hợp thông tin thống kê và thông tin không gian địa lý. Tuy nhiên, các nghiên cứu trên dù đã ứng dụng không gian địa lý trong một số lĩnh vực cụ thể nhưng chưa đề cập đến việc xây dựng một khung tổng thể kết hợp giữa khung thống kê và khung không gian địa lý theo chuẩn mực quốc tế và phù hợp với thực tiễn của Việt Nam. Trong bối cảnh việc tích hợp dữ liệu thống kê quốc gia với dữ liệu nền địa lý giúp gia tăng giá trị không chỉ cho các số liệu thống kê quốc gia mà còn hiệu quả sử dụng của dữ liệu địa lý nền, việc nghiên cứu xây dựng khung GFGS tại Việt Nam là thiết thực, giúp thực hiện thành công “Chiến lược dữ liệu quốc gia đến năm 2030” và các chiến lược phát triển Ngành như “Chiến lược phát triển ngành Đo đạc và Bản đồ Việt Nam và xây dựng hạ tầng dữ liệu không gian địa lý quốc gia đến năm 2030, tầm nhìn đến năm 2045”, “Chiến lược phát triển thống kê Việt Nam giai đoạn 2021-2030, tầm nhìn đến năm 2045”./.