Các nhà khoa học tạo bản đồ nghèo có độ phân giải cao bằng dữ liệu lớn
Một nhóm các nhà nghiên cứu từ Trung tâm Khoa học Phức hợp (CSH) và Đại học Trung Âu (CEU) đã tạo ra các bản đồ nghèo chi tiết bằng cách sử dụng các công cụ tính toán tập hợp thông tin khảo sát, dữ liệu và hình ảnh được cung cấp bởi các nguồn công khai như Google và Meta (Facebook).
Các bản đồ nghèo đói cho Sierra Leone và Uganda, hai quốc gia châu Phi cận Sahara có tình trạng nghèo đói cùng cực, sẽ được trình bày vào đầu tháng 5 tại Hội nghị Web 2023 ở Texas, Hoa Kỳ.
Trong nhiều năm, các nhà hoạch định chính sách, kế hoạch và nhà nghiên cứu đã dựa vào các cuộc điều tra và dữ liệu điều tra dân số để theo dõi và ứng phó với nghèo đói. “Tuy nhiên, việc thu thập thông tin này là tốn thời gian và chi phí” nhà nghiên cứu Lisette Espín-Noboa, một nghiên cứu sinh sau tiến sĩ tại CSH và CEU, đồng thời là tác giả đầu tiên, giải thích. “Một cuộc điều tra dân số có thể không bao gồm các khu vực khó tiếp cận.”
Phó giáo sư Márton Karsai của CEU – đồng tác giả của nghiên cứu, cho biết thêm: “Nếu bạn hỏi tại sao chúng ta cần bản đồ nghèo có độ phân giải cao, thì câu trả lời rất đơn giản. Những bản đồ nghèo cực kỳ chi tiết này có thể xác định những nơi cần thiết mà có thể sẽ không được ghi lại khi chỉ sử dụng dữ liệu điều tra dân số”
“Ở những khu vực thiếu thông tin trực tiếp, rất khó để ước tính tình trạng kinh tế xã hội của người dân. Trong nghiên cứu của chúng tôi, chúng tôi tập trung vào hai quốc gia, Uganda và Sierra Leone, nơi không có ước tính quy mô lớn, độ phân giải cao” – giáo sư János Kertész, trưởng khoa Mạng và Khoa học dữ liệu tại CEU và đồng tác giả của nghiên cứu chỉ ra.
Bộ dữ liệu
Trong bước đầu tiên, nhóm đã thu thập dữ liệu nhân khẩu học từ hai cuộc điều tra. Các nhà nghiên cứu cho biết: “Đặc biệt, chúng tôi tập trung vào bảng câu hỏi về đặc điểm nhà ở. Điều này giúp ước tính mức độ giàu có của hộ gia đình bằng cách xem xét chất lượng và số lượng của các cơ sở hoặc tài sản có sẵn tại nhà”.
Đối với cả hai quốc gia, điểm số của Chỉ số tài sản quốc tế (IWI) đã được tính toán. IWI cho biết một ngôi nhà sở hữu một bộ tài sản cơ bản tốt như thế nào. Giá trị càng thấp, chất lượng nhà ở càng thấp. Và giá trị càng cao, hộ gia đình càng giàu có.
Thứ hai, Espín-Noboa và các đồng nghiệp đã biên soạn bộ dữ liệu thứ hai về hình ảnh vệ tinh và dữ liệu hệ thống thông tin địa lý được cung cấp bởi các nguồn truyền thông xã hội và cộng đồng, như Google và Meta (Facebook).
Hơn 900 tính năng đã được trích xuất để cung cấp thông tin chi tiết về tình trạng kinh tế của dân số, sự phát triển cơ sở hạ tầng của khu vực và các chỉ số giàu có khác. Espín-Noboa giải thích: “Dữ liệu này cho biết có bao nhiêu ăng-ten được đặt trong một khu vực nhất định hoặc số người truy cập vào cùng một khu vực. Nó cũng có thể cho biết có bao nhiêu người dùng Facebook sở hữu một chiếc iPhone”.
Mô hình
Nhóm đã tạo ra ba mô hình máy học được đào tạo để xác định không chỉ mức độ giàu có trung bình của một địa điểm mà còn cả độ lệch chuẩn của nó. Cuối cùng, mục tiêu là cung cấp một bức tranh chính xác hơn về sự phân bổ của cải trong mỗi khu vực đông dân cư. Espín-Noboa chỉ ra: “Chúng tôi muốn biết sự giàu có thay đổi như thế nào trong một khu vực, hoặc liệu có sự bất bình đẳng hay không.
Các mô hình đã được huấn luyện để tìm hiểu mối tương quan giữa dữ liệu nhân khẩu học và điểm IWI cũng như các tính năng được trích xuất từ dữ liệu và hình ảnh do các nguồn công khai cung cấp. Espín-Noboa nói: “Ví dụ, họ học được rằng một giá trị tài sản cụ thể tương quan với một tập hợp các tính năng cụ thể. “Tiếp theo, chúng tôi đã thử nghiệm các mô hình bằng cách yêu cầu chúng dự đoán sự giàu có của các khu vực khác nhau.”
Nhóm đã phát triển ba mô hình: thứ nhất, mô hình dựa trên hình ảnh vệ tinh; thứ hai, nguồn cung ứng cộng đồng và dữ liệu truyền thông xã hội; và thứ ba là việc kết hợp cả hai. Karsai giải thích: “Chúng tôi muốn xác định những đặc điểm nào đóng góp nhiều nhất cho dự đoán về sự giàu có.
Sử dụng các mô hình, các nhà nghiên cứu đã tạo ra các bản đồ mô tả chi tiết mức độ nghèo đói của các cộng đồng ở Sierra Leone và Uganda. Họ cũng tạo ra một công cụ bản đồ tương tác để người dùng có thể so sánh sự giàu có được suy ra ở cả hai quốc gia và khám phá các mô hình máy học.
Karsai suy nghĩ: “Hiệu suất của các mô hình của chúng tôi có thể so sánh với những mô hình hiện đại nhất và trong một số trường hợp còn vượt trội hơn cả. Điều quan trọng là chúng tôi ước tính không chỉ tình trạng kinh tế của những người sống ở một địa điểm nhất định mà còn cả những biến động của địa phương. Hơn nữa, chúng tôi thấy rằng cần có các phương pháp khác nhau để ước tính thu nhập cao (nơi hình ảnh vệ tinh cung cấp kết quả tốt) và các vùng nghèo (nơi siêu dữ liệu – phương pháp dựa trên là tốt nhất).”
Đại dịch covid-19
Trong ba thập kỷ, Ngân hàng Thế giới đã ghi nhận sự sụt giảm số lượng người sống trong tình trạng nghèo cùng cực, được định nghĩa là sống với mức dưới 2,15 đô la một ngày. Xu hướng này đã bị gián đoạn bởi đại dịch COVID-19 vào năm 2020. Số người sống trong cảnh nghèo cùng cực đã tăng thêm 70 triệu lên hơn 700 triệu.
Theo Ngân hàng Thế giới, sự phục hồi đã không đồng đều kể từ đó. Và hầu hết những người vẫn đang sống trong tình trạng nghèo cùng cực đều ở vùng cận Saharan châu Phi, ở các khu vực bị ảnh hưởng bởi xung đột và ở các vùng nông thôn.
Do đó, Kertész chỉ ra rằng cần có những cách thức đo lường nghèo đói chính xác hơn, kịp thời hơn và tiết kiệm chi phí hơn. “Bằng cách kết hợp dữ liệu điều tra hộ gia đình truyền thống với các nguồn dữ liệu phi truyền thống, chúng tôi có thể lập bản đồ nghèo đói ở độ phân giải và quy mô cao hơn. Điều này có thể giúp các nhà hoạch định chính sách đưa ra quyết định dựa trên bằng chứng tốt hơn khi thiết kế các chương trình giảm nghèo và bất bình đẳng”, Kertész, người cũng là một giảng viên thỉnh giảng của CHS cho biết.
Ngọc Bích (dịch)
Nguồn: https://phys.org/news/2023-05-scientists-high-resolution-poverty-big.html