Từ ngày 15-17 tháng 4 năm 2020, Ủy ban Kinh tế Liên hợp quốc về châu Âu sẽ tổ chức Hội thảo về hiệu chỉnh dữ liệu thống kê tại Palais des Nations, Geneva, Thụy Sỹ.
Hội thảo nhằm mục đích tiến hành công việc hiệu chỉnh dữ liệu thống kê trong bối cảnh rộng hơn của chương trình làm việc của Nhóm cấp cao về hiện đại hóa thống kê chính thức (HLG-MOS). Đặc biệt, Hội thảo sẽ:
– Xác định các phương pháp mới có thể cải thiện chất lượng và hiệu quả của việc hiệu chỉnh và xử lý dữ liệu;
– Điều tra các rủi ro chất lượng thống kê phát sinh từ việc sử dụng các phương pháp và nguồn dữ liệu mới và các cách để giải quyết chúng;
– Phát triển các cách tiếp cận để chuẩn hóa và thực hiện các chức năng hiệu chỉnh thống kê;
– Tạo điều kiện chia sẻ kinh nghiệm, ý tưởng và công cụ để hiện đại hóa quy trình hiệu chỉnh và xử lý dữ liệu thống kê.
Đối tượng tham gia Hội thảo bao gồm các nhà phương pháp học, các nhà thống kê và nhà nghiên cứu số liệu thống kê chính thức làm việc về hiệu chỉnh và xử lý dữ liệu thống kê có được từ các cuộc điều tra, cuộc tổng điều tra, các nguồn hành chính và nguồn bên ngoài trong các lĩnh vực chủ đề khác nhau.
Chương trình của Hội thảo sẽ bao gồm các chủ đề quan trọng sau:
(i) Phương pháp: Về học máy và dữ liệu chuỗi thời gian và phương pháp mới / mới nổi: Chủ đề này bao gồm các phương pháp mới và mới nổi để cải thiện hoặc tối ưu hóa các phương pháp hiệu chỉnh và xử lý dữ liệu. Nó nhằm mục đích tập hợp các đóng góp thúc đẩy các ý tưởng và ứng dụng sáng tạo liên quan đến các khía cạnh khác nhau của hiệu chỉnh và xử lý dữ liệu.
(ii) Dữ liệu: Tổng điều tra 2021, dữ liệu hành chính, dữ liệu không gian địa lý, dữ liệu lớn và dữ liệu thay thế khác: Chủ đề này nhằm mục đích làm nổi bật các tính năng cụ thể của các dữ liệu khác nhau ngoài các điều tra chọn mẫu và cách giải quyết các thách thức của chúng để hiệu chỉnh và xử lý dữ liệu.
(iii) Phần mềm: Trình diễn phần mềm và phần mềm mã nguồn mở: Việc sử dụng các công cụ phần mềm phù hợp là cần thiết khi thiết kế và thực hiện các chiến lược hiệu chỉnh dữ liệu hiện đại. Phát triển các công cụ như vậy có thể là một công việc phức tạp, lâu dài và rất tốn kém. Đối với các tổ chức nhỏ hơn, sự phát triển như vậy thường vượt quá khả năng và hạn chế về ngân sách của họ. Nguyên tắc chia sẻ dường như là một giải pháp tối ưu trong những trường hợp như vậy. Mặc dù cộng đồng thống kê đã chia sẻ kiến thức và các khái niệm, phương pháp và thực tiễn tốt nhất, nhưng vẫn thiếu sự hợp tác thành công trong lĩnh vực trao đổi các công cụ phần mềm sẵn sàng hoạt động. Hợp tác quốc tế mạnh mẽ hơn về mặt này được coi là cơ hội chính để nâng cao hiệu quả phát triển phần mềm thống kê chất lượng cao.
(iv) Chất lượng: Đánh giá chất lượng dữ liệu và các chỉ tiêu: Trọng tâm chính của chủ đề này là các chỉ tiêu và kỹ thuật cho phép đánh giá chất lượng của hiệu chỉnh và xử lý dữ liệu và các quy trình liên quan và dữ liệu thu được từ các quy trình này.
(v) Các quy trình: Hiệu chỉnh trong một quy trình thiết lập theo định hướng, kiểm soát các quy trình thông qua tiêu chuẩn hóa và siêu dữ liệu: Việc sử dụng các tiêu chuẩn cho các khái niệm, phương pháp và quy trình để hiệu chỉnh dữ liệu là điều kiện tiên quyết để phát triển và áp dụng các phương pháp và công cụ hiện đại có thể sử dụng lại và để hỗ trợ chia sẻ kiến thức và hệ thống. Theo chủ đề này, các đóng góp có thể báo cáo về tiêu chuẩn hóa các phương pháp và thực hành hiệu chỉnh. Siêu dữ liệu không chỉ cung cấp thông tin bổ sung về dữ liệu được thu thập mà còn có thể đóng vai trò là công cụ kiểm soát trong một hệ thống xử lý dữ liệu được lên kế hoạch kỹ lưỡng và hoạt động tốt. Do đó, các yếu tố siêu dữ liệu là cần thiết để cấu trúc các bước quy trình và các luồng quy trình. Các đóng góp có thể thảo luận về tầm quan trọng của các quy trình và quy trình hiệu chỉnh dữ liệu dựa trên siêu dữ liệu cũng như các thách thức của việc xây dựng và duy trì các quy trình đó.
Tham gia Hội thảo đăng ký trước ngày 14 tháng 2 năm 2020 bằng cách điền vào mẫu đăng ký trực tuyến có sẵn tại: https://reg.unog.ch/event/31130/
Anh Tuấn (Lược dịch)
Nguồn: https://www.unece.org/fileadmin/DAM/stats/documents/ece/ces/ge.58/2020/mtg1/SDE_2020_INF_1.pdf