Các quốc gia tiên phong sử dụng Dữ liệu lớn và nhiều nguồn thông tin để tạo số liệu thống kê di cư chính thức bằng các khuyến nghị của UNECE

Tiềm năng của Dữ liệu lớn cho phép sản xuất số liệu thống kê chính thức nhanh hơn, rẻ hơn trong nhiều năm là một chủ đề nóng giữa các văn phòng thống kê.

UNECE đã đi đầu trong các quốc gia hướng dẫn thông qua nhiều thách thức về chất lượng dữ liệu, kỹ thuật xử lý, năng lực phân tích, khả năng truy cập và độ tin cậy của các nguồn. Trở lại năm 2013, Hội nghị các nhà thống kê châu Âu đã tiến hành đánh giá chuyên sâu về vai trò và tiềm năng của Dữ liệu lớn cho thống kê chính thức. Một bài viết đã hỏi về “Dữ liệu lớn có ý nghĩa gì đối với số liệu thống kê chính thức?”, được chuẩn bị bởi Nhóm cấp cao do UNECE đứng đầu cho việc hiện đại hóa các số liệu thống kê chính thức, được các cơ quan thống kê quốc gia sử dụng rộng rãi để điều hướng qua các khả năng to lớn nhưng đầy rủi ro.

Tuy nhiên, cho đến nay, các cơ quan thống kê quốc gia đã giới hạn việc sử dụng các nguồn Dữ liệu lớn để lập mô hình, đo tiêu chuẩn, cung cấp các dàn mẫu và so sánh các kết quả. Không thiếu các nghiên cứu và thí nghiệm thí điểm, nhưng thực sự sử dụng Dữ liệu lớn làm nguồn để đưa ra số liệu thống kê chính thức vẫn là một triển vọng tương lai cho nhiều người.

Cục Điều tra dân số Hoa Kỳ đã phá vỡ nền tảng mới tại Phiên làm việc về Thống kê di cư của UNECE-Eurostat năm 2019, diễn ra tại Geneva, trình bày kết quả công việc của họ về kết hợp Dữ liệu lớn và ước tính dựa trên điều tra để đưa ra số liệu thống kê di cư chính thức. Được sử dụng để tạo ra số liệu thống kê di cư từ thông tin thu thập được trong các cuộc điều tra, Cục Điều tra dân số đã bị ảnh hưởng bởi hậu quả hỗn loạn của cơn bão Maria năm 2018, dẫn đến chất lượng dữ liệu giảm mạnh từ các cuộc điều tra, buộc họ phải tìm kiếm dữ liệu họ cần ở nơi khác. Thông tin về các chuyến bay chở khách giữa Hoa Kỳ và Puerto Rico, do Cơ quan Thống kê Giao thông Vận tải Hoa Kỳ sản xuất, được kết hợp với dữ liệu từ các cuộc điều tra hộ gia đình để đưa ra các ước tính chính thức về di cư giữa hai khu vực này.

Hướng dẫn UNECE 2019 về Tích hợp dữ liệu để đo lường di cư, có khuyến nghị được tính đến trong phương pháp của Hoa Kỳ, giúp các quốc gia không chỉ làm việc với Dữ liệu lớn mà còn kết hợp nhiều nguồn như đăng ký dân số, hồ sơ nhập tịch và dữ liệu điều tra để cải thiện thống kê về nhập cư và di cư. Phiên làm việc của UNECE-Eurostat đã thấy các ví dụ từ Thổ Nhĩ Kỳ, Vương quốc Anh, Colombia, Chile và Hungary, giữa các nước khác.

Ở Colombia, việc tích hợp dữ liệu từ hai cơ quan đăng ký thống kê khác nhau, một là dựa trên đăng ký dân số và hai là di cư quốc tế, lần đầu tiên cho phép cơ quan thống kê lập bản đồ phân bố di cư ra nước ngoài từ các vùng khác nhau của Colombia. Ở Hungary, công việc đối chiếu dữ liệu hành chính và điều tra đang cho phép đo lường di cư theo vòng tròn, nơi mọi người thường xuyên vượt qua biên giới quốc gia để ở lại trung hoặc dài hạn. Thông tin từ hồ sơ bảo hiểm xã hội, sổ đăng ký địa chỉ và điều tra vi mô quốc gia được kết hợp để đưa ra ước tính chi tiết về số lượng người di cư tuần hoàn và xu hướng trong các số này, với thông tin về điểm đến, trình độ học vấn, tình hình gia đình và các đặc điểm quan trọng khác để hoạch định chính sách về di cư.

Đỗ Ngát (lược dịch)

Nguồn: http://www.unece.org/info/media/news/statistics/2019/countries-pioneer-use-of-big-data-and-multiple-information-sources-to-produce-official-migration-statistics-using-unece-recommendations/doc.html