Tăng cường đo lường đói nghèo thông qua dữ liệu lớn

Chấm dứt nghèo đói dưới mọi hình thức là mục tiêu đầu tiên trong 17 Mục tiêu Phát triển bền vững (SDGs). Vào năm 2019, chúng ta đã thực hiện nhiều biện pháp giảm nghèo trên toàn cầu và có những tiến bộ tốt, nhưng đại dịch Covid-19 đã phần nào đảo ngược xu hướng này. Phần lớn dân số Đông Nam Á vẫn chưa được tiếp cận với các nhu cầu cơ bản như: dịch vụ y tế, chế độ dinh dưỡng hợp lý và nhà ở, khiến nhiều trẻ em bị suy dinh dưỡng và mắc các bệnh có thể điều trị khỏi.

Thực hiện các cam kết của Chương trình nghị sự 2030 về Phát triển bền vững “không để ai bị bỏ lại phía sau”  đòi hỏi phải giám sát các xu hướng thực hiện SDG. Ở cấp quốc gia, các Cơ quan thống kê quốc gia (NSO) thường chịu trách nhiệm thu thập và báo cáo dữ liệu SDG bằng cách sử dụng các nguồn dữ liệu truyền thống như: điều tra, tổng điều tra dân số và dữ liệu hành chính. Tuy nhiên, gần một nửa số chỉ tiêu SDG (105/231 chỉ tiêu) ở Đông Nam Á là không có sẵn dữ liệu, các NSO đang nghiên cứu các nguồn và phương pháp thay thế để bù đắp vào các dữ liệu còn thiếu, chẳng hạn như: dữ liệu lớn và học máy. Hiện nay, việc quan sát trái đất và sử dụng dữ liệu điện thoại di động nhận được nhiều sự quan tâm nhất trong lĩnh vực báo cáo nghèo đói. Cả hai nguồn dữ liệu có thể giúp giảm phần lớn chi phí báo cáo, vì việc thu thập dữ liệu tốn ít thời gian và có tài nguyên hơn so với dữ liệu thông thường.

Các NSO của Thái Lan và Philippines, với sự hỗ trợ của Ngân hàng Phát triển Châu Á, đã tiến hành một nghiên cứu khả thi về việc sử dụng dữ liệu quan sát trái đất để dự đoán mức độ nghèo đói. Trong nghiên cứu, một thuật toán, mạng nơ-ron tích tụ (convolutional neural nets), đã được xây dựng trước trên cơ sở dữ liệu ImageNet để phát hiện các tính năng cấp thấp đơn giản trong hình ảnh như đường thẳng hoặc đường cong. Theo kỹ thuật học chuyển đổi, thuật toán sau đó được xây dựng để dự đoán cường độ của đèn ban đêm từ các đặc điểm trong ảnh vệ tinh ban ngày tương ứng. Sau đó, mức độ nghèo đói dựa trên thu nhập được ước tính bằng cách sử dụng các tính năng tương tự đã được tìm thấy để dự đoán cường độ ánh sáng ban đêm kết hợp với dữ liệu điều tra toàn quốc, dữ liệu dựa trên sổ đăng ký và thông tin không gian địa lý. Kết quả, các mô hình học máy mang lại độ chính xác lên đến 94% trong việc dự đoán các loại ảnh vệ tinh nghèo đói. Mặc dù kết quả học rất khả thi nhưng việc mở rộng mô hình và tích hợp dữ liệu lớn và máy học để thống kê nghèo đói và báo cáo SDG vẫn còn nhiều thách thức. Do đó, các NSO cần được hỗ trợ để đào tạo nhân lực và mở rộng thêm cơ sở hạ tầng kỹ thuật số của mình.

Các NSO có thể tìm kiếm sự hỗ trợ qua một số tổ chức lớn thông qua Các Ủy ban chuyên gia Liên hợp quốc (LHQ) về Dữ liệu lớn và Khoa học dữ liệu đối với thống kê chính thức (UN-CEBD). UN- CEBD giám sát một số nhóm nhiệm vụ, bao gồm Dữ liệu nền tảng toàn cầu của Liên hợp quốc (Global Platform LHQ) đã đưa ra một hệ sinh thái điện toán đám mây dịch vụ để tạo điều kiện hợp tác quốc tế liên quan đến dữ liệu lớn. Hai nhóm nhiệm vụ bổ sung tập trung vào Dữ liệu lớn cho các SDG và dữ liệu Quan sát Trái đất, cung cấp hướng dẫn kỹ thuật và đào tạo cho các NSO. Ở cấp khu vực, ESCAP Stats Café hàng tuần sẽ phổ biến nhiều tài liệu cung cấp một nền tảng chia sẻ kiến ​​thức về kinh nghiệm liên quan đến tác động của COVID-19 đối với hệ thống thống kê quốc gia. Stats Café bao gồm nhiều phiên dành riêng cho việc sử dụng các nguồn dữ liệu thay thế cho số liệu thống kê chính thức và SDG. Ngoài ra, ESCAP đã xuất bản tóm tắt chính sách về thực tiễn của khu vực trong việc sử dụng các nguồn dữ liệu phi truyền thống cho các số liệu thống kê chính thức.

Dữ liệu điện thoại di động cũng có thể được sử dụng để hiểu các điều kiện kinh tế xã hội khi không có số liệu thống kê truyền thống và để cung cấp mức độ chi tiết và tần suất cao hơn cho các ước tính hiện có. Ví dụ, hồ sơ chi tiết cuộc gọi cùng với việc mua tín dụng thời gian phát sóng, có thể được sử dụng để suy ra mật độ kinh tế, mức độ giàu có hoặc nghèo đói và để đo mức tiêu thụ thực phẩm. Một ví dụ có thể được tìm thấy trong ước tính nghèo ở Vanuatu dựa trên trình độ học vấn, đặc điểm hộ gia đình và chi tiêu. Chúng được tạo ra bởi Pulse Lab Jakarta – một cơ sở đổi mới liên kết với UN Global Pulse[1] và Chính phủ Indonesia.

Tuy nhiên, quyền truy cập vào dữ liệu điện thoại di động vẫn là một thách thức. Nó đòi hỏi nhiều yếu tố như: các thỏa thuận lâu dài với các nhà khai thác mạng di động để tìm ra mô hình truy cập dữ liệu phù hợp nhất, đảm bảo quyền riêng tư, bảo mật dữ liệu đồng thời cần đào tạo đội ngũ NSO có chuyên môn về lĩnh vực này. Ủy ban các chuyên gia của UN-CEBD – thông qua Nhóm về dữ liệu điện thoại di động– ESCAP nhằm hỗ trợ các NSO trong việc truy cập và sử dụng dữ liệu điện thoại di động thông qua các hội thảohướng dẫn và chia sẻ kinh nghiệm quốc gia. Hiện nay, một số NSO ở Châu Á và Thái Bình Dương có thể truy cập dữ liệu điện thoại di động hoặc đang đàm phán về quyền truy cập với các nhà khai thác mạng di động, nhưng vẫn chưa có NSO nào tích hợp nó vào báo cáo nghèo đói. Tuy nhiên, NSO Indonesia đang tìm kiếm nguồn dữ liệu này để báo cáo về 04 chỉ số SDG và đã dẫn đầu trong lĩnh vực này ở khu vực ở Đông Nam Á.

Do sự quan tâm và kinh nghiệm trong việc sử dụng dữ liệu điện thoại di động, hình ảnh vệ tinh và các nguồn dữ liệu thay thế khác cho các SDG ngày càng tăng trong nhiều NSO Đông Nam Á, vì vậy nhu cầu đào tạo và nâng cao năng lực trong lĩnh vực này cũng tăng lên. Việc trao đổi kiến ​​thức và cộng tác liên tục là chiến lược dài hạn tốt nhất cho các NSO và các cơ quan để theo dõi và xóa đói giảm nghèo cũng như đo lường 16 mục tiêu phát triển bền vững khác.

Ngọc Mai (dịch)

Nguồn: https://www.unescap.org/blog/enhancing-poverty-measurement-through-big-data

[1] là một sáng kiến ​​của Tổng thư ký Liên hợp quốc về dữ liệu lớn và AI vì sự phát triển, hành động nhân đạo và hòa bình.