Hệ thống thống kê chưa hoàn hảo hay sử dụng dữ liệu chưa hiệu quả? Đo lường hoạt động kinh tế thông qua các chỉ số ô nhiễm không khí hàng ngày

Dữ liệu vệ tinh toàn cầu đã tạo ra cuộc cách mạng hóa khả năng ước tính hoạt động kinh tế trong tình huống các nguồn dữ liệu khác không đáng tin cậy. Hiện nay, dữ liệu được sử dụng để ước tính hoạt động kinh tế là dữ liệu ánh sáng ban đêm từ vệ tinh. Một nghiên cứu gần đây đã sử dụng các dữ liệu vệ tinh về nitơ điôxit (NO2), sản phẩm phụ trực tiếp của quá trình đốt cháy để đo lường hoạt động kinh tế. Cách làm mới này có thể khắc phục những thiếu sót trong phương pháp đo lường hoạt động kinh tế bằng dữ liệu ánh sáng ban đêm từ vệ tinh.

Phát hiện mới cho thấy mặc dù ánh sáng ban đêm vẫn là chỉ số thích hợp hơn phản ánh cho tăng trưởng dài hạn ở các quốc gia có hệ thống thống kê yếu, nhưng dữ liệu vệ tinh về NO2 cung cấp thêm thông tin về những biến động ngắn hạn trong hoạt động kinh tế.  Dữ liệu vệ tinh về NO2 cải thiện việc đo lường hoạt động kinh tế ở mọi nơi – kể cả các nền kinh tế tiên tiến và có thể xếp hạng các hệ thống thống kê quốc gia dựa trên chất lượng của chúng trong một số trường hợp.

Dữ liệu vệ tinh về NO2 có lợi thế rõ ràng so với dữ liệu ánh sáng ban đêm trong vai trò một chỉ số về hoạt động kinh tế. Nó được đo vào ban ngày khi các doanh nghiệp mở cửa và mọi người đang làm việc. Nó cũng ở gần nguồn phát thải, ví dụ động cơ, xe cộ hoặc ống khói và có tuổi thọ ngắn trong khí quyển – dưới một ngày. Điều quan trọng là dữ liệu được công bố trực tuyến ngay sau khi thực hiện phép đo.

Không nên nhầm lẫn các chỉ số NO2 của vệ tinh với các chỉ số từ các trạm quan trắc trên mặt đất. Chúng được đo lường không thường xuyên, đặc biệt ở các nước đang phát triển. Chúng cũng có sự phân bố không gian không đồng đều. Việc đo lường mức độ ô nhiễm ở một giao lộ đô thị hay ở nông thôn không giống nhau.

Nghiên cứu mới sử dụng mật độ cột dọc của NO2 tầng đối lưu từ một thiết bị giám sát ôzôn trên vệ tinh Aura của NASA. Các cột này có độ phân giải không gian cao – tương đương với 13 km × 24 km. Hào quang là một phần của “A-Train”, một dòng vệ tinh di chuyển theo lộ trình từ cực này sang cực khác đi qua xích đạo luôn diễn ra vào khoảng 1:30 chiều.

Một minh họa về các chỉ số NO2 có thể được thấy rõ qua các đợt phong tỏa trong đại dịch Covid-19. Hình 1 cho thấy sự thay đổi về lượng khí thải NO2 giữa quý đầu tiên của năm 2019 và 2020 tại Trung Quốc. Tỉnh Hồ Bắc, nơi có thành phố Vũ Hán, có sự suy giảm mạnh nhất (màu xanh lam). Ngoài ra các bản đồ tương tự cho Châu Âu và Hoa Kỳ cũng tiết lộ cường độ phong tỏa khác nhau giữa các khu vực.

Nghiên cứu mới không chỉ cải thiện các đo lường hoạt động kinh tế trước đây nhờ chỉ số mà còn nhờ phương pháp thống kê của nó. Nghiên cứu được xây dựng trên khung đo lường sai số đã được sử dụng bởi các nhà nghiên cứu: Chen và Nordhaus và Henderson et al. 

Hình 1. Thay đổi lượng khí thải NO2 trong thời gian phong tỏa vì Covid-19

Đóng góp về phương pháp luận của nghiên cứu có thể được mô tả một cách trực quan. Cả GDP chính thức và NO2 đều tương quan với mức độ hoạt động kinh tế không quan sát được. Trong trường hợp chỉ tiêu GDP, sai số đo lường giảm dần cùng với chất lượng của hệ thống thống kê. Để thống nhất với các phân tích trước đó, xếp hạng chất lượng này dựa trên bảng World Penn Tables mở rộng, với danh mục “A” tương ứng với các hệ thống thống kê hiện đại nhất và danh mục “E” cho các quốc gia không có tổ chức thống kê.

Đối với chỉ số NO2, hoạt động kinh tế có thể dẫn đến cường độ phát thải khác nhau theo không gian và thời gian. Ví dụ, các quốc gia tham gia vào lĩnh vực dịch vụ dự kiến ​​​​sẽ có lượng khí thải thấp hơn so với các quốc gia chuyên sản xuất hoặc khai thác dầu mỏ. Tương tự, nghiên cứu chỉ ra rằng các quốc gia thuộc loại A và B có xu hướng giảm dần NO2 theo thời gian, một kết quả có thể xảy ra từ nỗ lực khử cacbon của quốc gia đó.

Nghiên cứu kết hợp hai đo lường này bằng cách loại bỏ các hoạt động kinh tế, điều này cho phép biểu thị trực tiếp NO2 dưới dạng một hàm của GDP cộng với một số sai số. Đây là một mối quan hệ có thể được ước tính theo kinh nghiệm, vì cả NO2 và GDP đều có thể quan sát được. Nhưng kết quả hồi quy tiêu chuẩn sẽ bị sai lệch vì sai số trong mối quan hệ này có tương quan với GDP.

Để giải quyết vấn đề này, các ước tính dựa trên ánh sáng ban đêm giả định rằng không có sai lệch trong trường hợp các quốc gia được xếp hạng A. Thay vào đó, sử dụng ánh sáng ban đêm như một công cụ để xác định mối quan hệ ước tính. Dữ liệu vệ tinh về NO2 và ánh sáng ban đêm được đo tại các thời điểm khác nhau, bằng các vệ tinh khác nhau và bằng các cảm biến khác nhau. Ngoài ra, hoạt động cực quang và các chu kỳ của mặt trăng là những mối quan tâm đáng kể đối với việc sử dụng dữ liệu ánh sáng ban đêm, nhưng NO2 thì không.

Nhờ ước tính không chệch này, có hai biện pháp đo lường hoạt động kinh tế thực sự: GDP chính thức và NO2. Mức độ hoạt động kinh tế thực sự có thể được tính bằng bình quân gia quyền của hai thước đo này, với quyền số tối ưu trên GDP chính thức càng thấp thì hệ thống thống kê của quốc gia càng yếu.

Phát hiện trên cho thấy đối với các quốc gia được xếp hạng A như Hoa Kỳ, toàn bộ 9% thước đo tối ưu về hoạt động kinh tế thực sự phải đến từ chỉ số NO2. Đối với xếp hạng B, bao gồm Tây Ban Nha và Đức, trọng số tối ưu tăng lên 28 %. Ở các quốc gia được xếp hạng C, bao gồm cả Trung Quốc, tỷ lệ này lên tới 40%. Ở hạng D và E, bao gồm cả Zimbabwe và Cộng hòa Yemen, tỷ lệ này lần lượt là 64% và 80%.

Sự khác biệt giữa thước đo tối ưu này về hoạt động kinh tế và GDP phản ánh mức độ sai lệch trong thống kê chính thức. Về giá trị tuyệt đối, sai sót trung bình nằm trong khoảng từ 0,25 % ở các quốc gia được xếp hạng A đến 5% ở các quốc gia được xếp hạng E – nhiều hơn đáng kể so với ước tính dựa trên ánh sáng ban đêm.

Ngoài mức trung bình, phép đo tối ưu này về hoạt động kinh tế thực sự phát hiện ra nhiều lỗi nghiêm trọng đối với các quốc gia và trong các năm cụ thể:

Dịch bệnh. Vào năm 2020, GDP chính thức giảm từ 1 đến 2% so với hoạt động kinh tế thực ở một số nền kinh tế tiên tiến có hệ thống thống kê mạnh.

Đa quốc gia. Ở một nền kinh tế tiên tiến khác, việc đưa tài sản trí tuệ vào tài khoản quốc gia đã dẫn đến việc GDP chính thức đánh giá quá cao hoạt động kinh tế thực tế tới 7 %.

Khủng hoảng tài chính. Trong một cuộc khủng hoảng nợ lớn, GDP chính thức của một quốc gia có thu nhập cao đã giảm nhiều hơn 3 % so với hoạt động kinh tế thực sự của quốc gia đó.

Những cú sốc về giá dầu. Sau khi khai trương một đường ống dẫn dầu chính, hoạt động kinh tế thực sự ở một quốc gia xuất khẩu dầu mỏ đã tăng ít hơn 10 % so với GDP chính thức của quốc gia đó.

Xung đột. Ở một số quốc gia đang trải qua chiến tranh, sự sụt giảm trong hoạt động kinh tế thực tế thấp hơn 10 % so với chỉ tiêu GDP chính thức.

Siêu lạm phát. GDP chính thức đã phóng đại mức giảm trong hoạt động kinh tế thực tế 43 điểm % ở một quốc gia có thu nhập trung bình, nhưng lại phóng đại mức giảm 47 điểm % ở một quốc gia khác.

Phương sai của sai số hàng năm về hoạt động kinh tế thực theo thời gian cũng cho phép đánh giá chất lượng của các hệ thống thống kê giữa các quốc gia. Xếp hạng dựa trên dữ liệu này dẫn đến sự xáo trộn đáng kể so với các phân loại thường được sử dụng.

Các ứng dụng khả thi khác của phương pháp được đề xuất bao gồm đo lường GDP địa phương ở các quốc gia lớn, tạo ước tính hàng quý về tăng trưởng GDP ở các quốc gia nơi chỉ có số liệu chính thức hàng năm và “dự báo” GDP trong khi chờ số liệu chính thức được công bố.

Phạm Hạnh (dịch)

Nguồn: https://blogs.worldbank.org/developmenttalk/imperfect-statistical-systems-data-manipulation-measuring-economic-activity