Tiếp theo blog của chúng tôi hướng dẫn cách sử dụng công cụ Thống kê Trực tuyến (SOL) trên Diễn đàn Nghèo đói và Bất bình đẳng (PIP). Trong blog này, chúng tôi trình bày một ví dụ thực tế về việc sử dụng công cụ SOL và Jupyter[1] trong diễn đàn để thực hiện minh họa về phân tích nghèo và bất bình đẳng đơn giản cho một quốc gia. Chúng tôi làm trực tiếp trên dữ liệu vi mô phù hợp được sử dụng cho các ước tính chính thức về nghèo đói và bất bình đẳng của Ngân hàng Thế giới.
Người sử dụng nên nhớ rằng không phải tất cả các dữ liệu vi mô được báo cáo trong PIP đều có sẵn trong SOL vì lý do bảo mật dữ liệu. Quyền truy cập được cung cấp cho các cuộc khảo sát đã được công bố công khai bởi mỗi quốc gia. Ngoài các tổng phúc lợi chính thức của Ngân hàng Thế giới (cùng với các biến đổi giảm phát giá cần thiết), bao gồm các biến đổi về cá nhân và hộ gia đình, chẳng hạn như độ tuổi, giới tính, giáo dục và khả năng tiếp cận các dịch vụ cơ sở hạ tầng, nhằm mở rộng cơ hội nghiên cứu cho người sử dụng SOL.
Sử dụng Jupyter Notebook[2] với dữ liệu khảo sát trong SOL, người ta thực hiện các phép tính bằng cách sử dụng Stata, tạo biểu đồ và cung cấp phân tích kết quả. Đối với ví dụ này, chúng tôi đã chuẩn bị một Notebook, mà người dùng có thể tìm thấy trong tab “Không gian công cộng (Public space)” trong SOL. Notebook được chia thành năm phần và mỗi phần được cấu trúc gồm có giải thích, mã và phân tích kết quả. Năm phần là: các thước đo nghèo cơ bản; phân tích phân phối phúc lợi; phân tích bất bình đẳng; tỷ lệ đói nghèo và những thay đổi theo không gian và thời gian; và phân tích bổ sung bằng cách sử dụng các đặc điểm cá nhân và hộ gia đình.
Notebook mô tả cách phân tích đơn giản với mã thực thi, công thức toán học, đồ thị, kết quả và tường thuật có thể được thực hiện bằng cách sử dụng SOL. Chúng tôi đặc biệt khuyến khích người dùng sử dụng SOL để phân tích riêng, tạo tài liệu đào tạo hoặc chia sẻ kiếnthức. Một trong những ưu điểm của SOL là không cần thiết lập hoặc cấu hình và người ta có thể chia sẻ Notebook với những người khác để tái tạo hoặc cộng tác. Notebook với các kết quả và biểu đồ đã thực thi / lưu trữ cũng có thể được xuất sang các tài liệu như PDF để chia sẻ hoặc phổ biến. Bạn có thể xem ví dụ về tài liệu được xuất dưới dạng PDF của Notebook mà chúng tôi trình bày ở trên.
ĐN (dịch)
Nguồn: https://blogs.worldbank.org/opendata/using-pips-statistics-online-sol-your-poverty-and-inequality-analysis
[1] Jupyter là một nền tảng tính toán khoa học mã nguồn mở, với khả năng nổi bật cho phép tương tác trực tiếp với từng dòng code (interactive), hỗ trợ hơn 40 ngôn ngữ lập trình, trong đó tập trung vào 3 ngôn ngữ là Julia, Python và R
[2] là một ứng dụng chạy trên nền tảng web, cho phép bạn đưa cả code Python và các thành phần văn bản phức tạp như hình ảnh, công thức, video, biểu thức… vào trong cùng một file giúp cho việc trình bày trở lên dễ hiểu, giống như một file trình chiếu nhưng lại có thể thực hiện chạy code tương tác trên đó. Các file notebook này có thể được chia sẻ với mọi người và có thể thực hiện lại các công đoạn một cách nhanh chóng và chính xác như những gì tác giả của file này tạo ra.