Các thiết bị điện tử cho phép thực hiện đổi mới trong thiết kế điều tra, ví dụ như bảng câu hỏi thích ứng với các câu trả lời. Tài liệu được xuất bản gần đây đã mô tả phương pháp và kết quả chi tiết một công cụ mới tiềm năng có thể dựa trên điều tra để xác định hộ gia đình có đủ điều kiện nhận trợ cấp xã hội hay không. Khoảng 40% hộ gia đình ở Indonesia nhận được các gói trợ cấp xã hội thường xuyên. Bên cạnh các tiêu chí phân loại như hộ gia đình có trẻ em, các chương trình sử dụng một phương pháp để xác định tính đủ điều kiện, được gọi là kiểm định giá trị trung bình đại diện (PMT). PMT thu thập một tập hợp các đặc điểm của hộ gia đình, sau đó sử dụng mô hình thống kê ước tính mức tiêu thụ làm thước đo kinh tế. Các hộ gia đình có mức tiêu dùng ước tính thấp hơn ngưỡng đủ điều kiện sẽ nhận được hỗ trợ.
Chi phí thu thập dữ liệu PMT là đáng kể vì một số cơ quan đăng ký xã hội chứa dữ liệu về hơn một nửa dân số của một quốc gia. Chỉ có cuộc điều tra dân số có thể so sánh với một bài tập thu thập dữ liệu lớn như vậy. Tuy điều tra dân số bao gồm nhiều hộ gia đình hơn, nhưng nó thu thập ít thông tin hơn. Ở những địa điểm mà các cuộc điều tra nhắm mục tiêu được thực hiện dưới dạng ‘toàn bộ’, hàng ngàn điều tra viên cần được trả tiền cho thời gian và chi phí đi lại của họ. Do đó, các cuộc điều tra toàn bộ chỉ được tiến hành vài năm một lần. Điều này không phải lý tưởng vì nghèo đói luôn thay đổi và tình trạng hội đủ điều kiện thực sự của nhiều hộ gia đình cũng thay đổi. Quan trọng hơn, mặc dù chi phí điều tra thường ở mức vừa phải so với lợi ích, nhưng chi phí điều tra cao cũng có thể hạn chế số lượng hộ gia đình được điều tra. Điều này dẫn đến nhiều người bỏ lỡ lợi ích vì họ chưa bao giờ được nắm bắt trong cuộc điều tra.
Từ hai ý tưởng cơ bản, các nhà nghiên cứu đã phát triển một phương pháp tuân theo phương pháp PMT nhưng có khả năng giảm đáng kể chi phí điều tra. Đầu tiên, nhiều câu hỏi trong bảng câu hỏi nhắm mục tiêu có mối tương quan cao. Biết một câu trả lời có nghĩa là chúng ta có thể không cần biết những câu trả lời khác. Ví dụ: nếu chúng ta đã biết mái nhà được làm bằng loại vật liệu gì, thì việc hỏi loại vật liệu tường của ngôi nhà không cung cấp thêm thông tin chi tiết về tình hình tài chính của gia đình. Việc chọn một tập hợp nhỏ các biến có khả năng dự đoán cao sẽ làm giảm sự dư thừa mà không làm mất khả năng dự đoán. Sắp xếp thứ tự các câu hỏi từ dự đoán nhiều nhất đến ít dự đoán nhất, hình 1 bên dưới cho thấy số lượng câu hỏi cần thiết để đạt được một mức tỷ lệ lỗi loại trừ (EER) nhất định, ví dụ: tỷ lệ hộ gia đình đủ điều kiện sai bị coi là không đủ điều kiện. Mỗi dòng hiển thị hiệu suất của một phương pháp lựa chọn biến trên dữ liệu từ cuộc khảo sát SUSENAS của Indonesia (máy tăng cường độ dốc, hoặc GBM, là mô hình dự đoán cơ bản, ngoại trừ trường hợp nhóm lasso). Đối với lựa chọn từng bước về phía trước, kết quả chỉ ra rằng một bảng câu hỏi đầy đủ gồm 37 câu hỏi chỉ giảm được 0,3 điểm phần trăm EER so với 22 câu hỏi cuối cùng. Các nhà hoạch định chính sách có thể sử dụng kết quả mô phỏng để quyết định mức phạt về độ chính xác mà họ sẵn sàng chấp nhận đối với các câu hỏi ngắn hơn.
Hình 1: Các câu hỏi cần thiết để đạt được mức độ chính xác nhắm mục tiêu với Bảng câu hỏi rút gọn
Hình 2: Ví dụ hộ gia đình về dừng sớm, ghi lại mức tiêu thụ ước tính sau 12 câu hỏi
Tóm lại, cách tiếp cận đầu tiên sắp xếp các câu hỏi theo khả năng dự đoán của chúng và cắt ngắn bảng câu hỏi ở độ dài mang lại độ chính xác mong muốn cho hộ gia đình trung bình. Cách tiếp cận thứ hai đặt câu hỏi theo trình tự tương tự, không cắt bớt và dừng điều tra sớm khi có đủ bằng chứng để quyết định xem một hộ gia đình rõ ràng đủ điều kiện hay không đủ điều kiện. Vì những cách tiếp cận này dựa trên các cơ chế khác nhau nên chúng cũng có thể được kết hợp để tạo thành một cách tiếp cận được gọi là Ngừng sớm cắt ngắn hoặc TrESt. Hình 3 cho thấy phương pháp này có thể đạt được một mức độ chính xác nhất định với ít câu hỏi hơn so với cách tiếp cận từng thành phần riêng lẻ. Sự khác biệt theo chiều dọc giữa các chấm màu vàng (dừng sớm) hoặc đường màu xanh lục (bảng câu hỏi bị cắt ngắn) và đường màu đỏ (TrESt) cho thấy sự cải thiện đáng kể: khoảng 10 so với 15 câu hỏi với tỷ lệ lỗi loại trừ khoảng 26,4%. Phần thu phóng so sánh TrESt với đường cơ sở PMT tiêu chuẩn tương tự như đường cơ sở hiện đang được sử dụng ở Indonesia. Khi PMT cơ bản chọn khoảng 23 câu hỏi, TrESt chỉ cần khoảng 10 câu hỏi để phù hợp với mức độ chính xác của nó.
Hình 3: Dừng sớm cắt ngắn vượt trội so với các phương pháp thành phần của nó
Tài liệu nghiên cứu về phương pháp mới đã trình bày thông tin có giá trị để cung cấp cho các nhà hoạch định chính sách sự lựa chọn về chi phí so với độ chính xác nhằm phù hợp với bối cảnh và khắc phục những hạn chế. Phần thảo luận nêu bật những lưu ý quan trọng. Ví dụ, các khoản tiết kiệm khả thi phụ thuộc vào cả hai yếu tố địa lý – thời gian di chuyển càng dài thì lợi ích tương đối thu được từ các bảng câu hỏi ngắn càng nhỏ – và sự đa dạng của các chương trình cũng như các ngưỡng liên quan mà bảng câu hỏi phải đáp ứng . Cuối cùng, tài liệu làm việc bao gồm một mô phỏng áp dụng TrESt ở Jakarta, trong đó thời gian tiết kiệm được thông qua các câu hỏi ngắn hơn có thể được sử dụng để khảo sát nhiều hộ gia đình hơn và do đó giảm các lỗi loại trừ tổng thể.
Phạm Hạnh (dịch)