Ngày càng có nhiều nhà nghiên cứu có nhu cầu truy cập vào dữ liệu vi mô (dữ liệu về cá nhân hoặc doanh nghiệp) do các cơ quan thống kê quốc gia hoặc các cơ quan kiểm soát dữ liệu khác thu thập. Nếu dữ liệu vi mô là thông tin nhận dạng cá nhân, thì cách thông thường nhất để người kiểm soát dữ liệu chia sẻ chúng phải tuân thủ theo luật bảo mật (đặc biệt là Quy định chung về bảo vệ dữ liệu của Liên minh Châu Âu) là phát hành dữ liệu vi mô ẩn danh. Tuy nhiên, các nhà phân tích dữ liệu thường cần quyền truy cập vào dữ liệu vi mô gốc để tránh mất thông tin do ẩn danh. Để đáp ứng nhu cầu đó, các trung tâm tiếp cận an toàn (trực tiếp tại trung tâm hoặc trực tuyến) đã được thành lập bởi một số cơ quan thống kê quốc gia. Trong các trung tâm này, người dùng có thể chạy các phân tích trên dữ liệu gốc bằng phần mềm của đơn vị kiểm soát và đơn vị kiểm soát sẽ kiểm tra kết quả phân tích của người dùng trước khi trả lại các kết quả đó cho họ, để đảm bảo người dùng không mang về nhà bất kỳ kết quả nào có thể bị rò rỉ dữ liệu vi mô bí mật đã được tính toán trên đó. Kiểm tra đầu ra hiện được thực hiện với người kiểm tra, điều này gây tốn kém và chậm, đặc biệt là vì người kiểm tra cần phải có chuyên môn cao về thống kê. Trong công việc này, chúng tôi đã khám phá việc sử dụng học máy để tự động hóa một phần việc kiểm tra đầu ra.
Nội dung chi tiết xem tại file đính kèm