Hội nghị về “Xu hướng hiện nay của số liệu điều tra thống kê” năm 2019

Bất kỳ phân tích thống kê nào cũng cần những thông tin đáng tin cậy về tổng thể mục tiêu dưới dạng bộ dữ liệu. Độ chính xác của các ước lượng hoặc những đo lường được tính toán bởi một nhà thống kê phụ thuộc trực tiếp vào thông tin có trong bộ dữ liệu mà người đó sử dụng. Tuy nhiên, thường các bộ dữ liệu như vậy có thể không có đầy đủ thông tin để đưa ra các ước tính với độ chính xác cần thiết. Nó có thể không có đủ các quan sát, điều này sẽ làm giảm độ chính xác của các ước lượng. Phổ biến hơn là không có đủ các biến để xây dựng một mô hình có ý nghĩa. Một vấn đề khác cũng khá phổ biến là dữ liệu có sẵn không đại diện cho tổng thể mục tiêu do thông tin chọn mẫu và hoặc do tỷ lệ không trả lời cao. Mặc dù một nhà thống kê muốn thiết kế và thu thập dữ liệu phù hợp cho nghiên cứu mà mình quan tâm, nhưng việc thu thập dữ liệu thường rất tốn kém. Kết quả là, người ta cần đưa ra các biện pháp để hợp nhất các bộ dữ liệu khác nhau hoặc gán thông tin từ các quan sát tương tự trong cùng một dữ liệu.

Ngày nay, cũng dễ dàng thu thập và lưu trữ các tập dữ liệu lớn, từ các ứng dụng dựa trên web, mạng xã hội hoặc hồ sơ y tế,…cung cấp nhiều hơn những cơ hội thú vị về thu thập và lưu trữ dữ liệu. Các nguồn dữ liệu như vậy có thể cung cấp hàng triệu quan sát trên hàng ngàn biến, đó là những gì một nhà thống kê cần. Tuy nhiên, các bộ dữ liệu này không được thu thập theo bất kỳ cách thiết kế nào. Nói cách khác, chúng có thể quan sát và có thể không đại diện cho tổng thể được phân tích.

Việc sử dụng các nguồn dữ liệu lớn có hay không tích hợp được với dữ liệu điều tra, kênh thu thập được thiết kế cẩn thận và thường sẽ có lợi trong việc tính toán số liệu thống kê chính thức, phục vụ việc đưa ra các quyết định chính sách rất được quan tâm. Tích hợp các nguồn dữ liệu khác nhau là một chủ đề nghiên cứu phổ biến trong một số ngành thống kê hiện tại.

Từ ngày 13-16 tháng 8 năm 2019, Viện Khoa học Toán học, Đại học Quốc gia Singapore tổ chức hội nghị “Xu hướng hiện nay của số liệu điều tra thống kê ” sẽ cho thấy sự tiến bộ gần đây trong lĩnh vực phân tích dữ liệu điều tra, bằng cách đặc biệt nhấn mạnh vào các lĩnh vực mới nổi, chuyên giải quyết các vấn đề đặt ra bởi những tiến bộ trong thu thập dữ liệu và kỹ thuật tính toán. Nó cũng sẽ điều tra các hướng phát triển trong tương lai trong các lĩnh vực quan tâm này. Danh sách một phần của các chủ đề nhỏ sẽ được thảo luận tại hội nghị như sau:

(1) Ước lượng khu vực nhỏ

(2) Bảo mật dữ liệu

(3) Liên kết bản ghi và gán dữ liệu (Entity Resolution)

(4) Dữ liệu tổng hợp và giới hạn công bố thống kê

(5) Dữ liệu lớn và Chọn mẫu điều tra

(6) Dữ liệu lớn trong Thống kê nhà nước

(7) Kỹ thuật thay thế lặp (Ký thuật MI-kỹ thuật xử lý dữ liệu missing)

(8) Khoa học xã hội tính toán và nhân văn số

(9) Khảo sát theo chiều dọc

(10) Bản đồ nghèo

(11) Mô hình mô phỏng vi mô

(12) Mạng xã hội

(13) Khảo sát trong thế giới đang phát triển

Hội nghị này là một phần của chương trình lớn hơn về “Tích hợp dữ liệu thống kê”, được tổ chức tại Viện Khoa học toán học, Đại học Quốc gia Singapore, từ ngày 5 đến 16 tháng 8 năm 2019 và hội nghị cũng được công nhận là một hội nghị vệ tinh cho Đại hội Thống kê Thế giới ISI lần thứ 62, sẽ được tổ chức tại Kuala Lumpur từ ngày 18 đến 23 tháng 8 năm 2019.

Vân Anh (lược dịch)

Nguồn: https://ims.nus.edu.sg/orgsites/2019data/