Tại sao không nên thay thế cuộc tổng điều tra dân số ở Anh bằng các nguồn dữ liệu thay thế

Cứ 10 năm một lần kể từ năm 1801 – ngoại trừ thời gian chiến tranh gián đoạn vào năm 1941 – chính phủ Anh lại tiến hành cuộc tổng điều tra dân số ở Anh và xứ Wales. Đây là một sự kiện lớn. Dữ liệu trong cuộc tổng điều tra gần đây nhất, vào năm 2021, vẫn đang được công bố, với các báo cáo cuối cùng được lên lịch vào năm 2025. Tuy nhiên, đã xuất hiện những nghi ngờ về việc liệu cuộc tổng điều tra tiếp theo vào năm 2031 có thực sự diễn ra hay không.

Cơ quan Thống kê quốc gia (ONS) hiện đang chuẩn bị các khuyến nghị sau cuộc tham vấn cộng đồng về tương lai của thống kê dân số và di cư ở Anh và xứ Wales, được tiến hành trong 04 tháng vào năm 2023. Các học giả bày tỏ lo ngại rằng chính phủ có ý định loại bỏ tổng điều tra dân số hoàn toàn và ủng hộ việc sử dụng các nguồn dữ liệu dân số hành chính khác.

Vấn đề không phải là liệu dữ liệu hành chính có thể bổ sung cho dữ liệu tổng điều tra dân số hay không – chắc chắn là có thể. Tuy nhiên, 85 học giả, những người ký thư ngỏ vào tháng 10 năm 2023, cho rằng chính phủ chưa đưa ra lập luận thuyết phục về việc dữ liệu hành chính có thể thay thế tất cả các chức năng của tổng điều tra dân số. Họ cho rằng việc chỉ sử dụng các nguồn thông tin thay thế mà không có tổng điều tra dân số để so sánh cuối cùng có thể dẫn đến sự thiếu chính xác.

Một nguồn tài nguyên vô tận

Tổng điều tra dân số nhằm mục đích thu thập thông tin về tất cả những người cư trú, lần cuối cùng là ngày 21 tháng 3 năm 2021 tại Anh, xứ Wales và Bắc Ireland và một năm sau (20 tháng 3 năm 2022) tại Scotland. Chính tham vọng thu thập dữ liệu về toàn bộ dân số đã giúp tổng điều tra dân số trở nên độc đáo, không thể so sánh với các cuộc điều tra xã hội nhỏ hơn nhiều.

Dữ liệu được thu thập theo cách này rất quan trọng để hiểu được sự thay đổi về địa lý xã hội và nhân khẩu học của Vương quốc Anh. Nó được các tổ chức, doanh nghiệp, chính quyền địa phương và các học giả sử dụng để thông báo kế hoạch kinh doanh và dịch vụ, lập bản đồ ai đang sống ở đâu và phân bổ vốn để đáp ứng nhu cầu và nhu cầu thay đổi.

Nhưng việc thu thập, xử lý, lưu trữ và xuất bản rất tốn kém. ONS ước tính chi phí của cuộc tổng điều tra dân số năm 2021 vào khoảng 900 triệu bảng Anh. Số tiền đó có thể chỉ tính ra ở mức 1,50 bảng Anh mỗi người, nhưng đó vẫn là một khoản tiền lớn. Ngoài vấn đề tài chính, còn có những câu hỏi xung quanh tính hiệu quả của cuộc khảo sát khi nhiều tổ chức đã thu thập dữ liệu công dân như một công việc thường lệ. Ian Diamond – nhà thống kê quốc gia của Anh và xứ Wales phát biểu , “Chúng ta đã đạt đến điểm có thể đặt ra một câu hỏi nghiêm túc về vai trò của tổng điều tra dân số trong hệ thống thống kê của chúng ta.”

Tài nguyên thay thế

Câu hỏi đầu tiên được đặt ra là liệu một hình thức thu thập dữ liệu có nguồn gốc từ thế kỷ 19 có thể được hiện đại hóa triệt để vào thế kỷ 21 hay không. Tất nhiên, đã có những thay đổi trong cuộc tổng điều tra dân số trong nhiều thập kỷ. Hầu hết dữ liệu hiện nay được thu thập và phổ biến dưới dạng điện tử thay vì trên giấy. Ngoài ra còn có nhiều cách hơn để tự do khám phá và trực quan hóa dữ liệu. Hơn nữa, các câu hỏi mà cuộc tổng điều tra dân số đưa ra sẽ được cập nhật theo thời gian. Năm 1991, câu hỏi về sắc tộc được đưa vào và năm 2001, câu hỏi về tôn giáo cũng được thêm vào. Vào năm 2021, biến số nhận dạng giới tính đã được thay đổi.

Tuy nhiên, vấn đề quan trọng hơn là liệu trong thời đại mà các dữ liệu khác về con người và địa điểm được các tổ chức công (và tư nhân) thu thập thường xuyên, liệu chúng ta có cần tổng điều tra dân số hay không. Tài liệu tham vấn của ONS, có tựa đề “Tương lai của thống kê dân số và di cư ở Anh và xứ Wales”, gợi ý rằng nhiều nguồn dữ liệu hành chính khác nhau có thể được liên kết và đối chiếu để tạo ra một cuộc tổng điều tra dân số giả. Đây không phải là một ý kiến ​​mới.

Một cách hữu ích, không có lý do gì để hạn chế các mối liên kết này trong chu kỳ cập nhật mười năm một lần. Chúng ta có thể có dữ liệu kịp thời hơn phản ánh những thay đổi đối với xã hội khi chúng xảy ra, thay vì phải chờ một thập kỷ hoặc hơn để cuộc tổng điều tra dân số tiếp theo thu thập dữ liệu và cung cấp dữ liệu để phân tích. Điều đó sẽ cực kỳ hữu ích cho việc nghiên cứu, hiểu biết và lập bản đồ về sự thay đổi xã hội và nhân khẩu học.

Khả năng thiếu chính xác

ONS đã nỗ lực rất nhiều để khám phá những gì họ gọi là “các lựa chọn thay thế tổng điều tra dân số” và để hiểu những ưu điểm và nhược điểm tiềm ẩn của chúng. Tuy nhiên, giả định rằng tổng điều tra dân số là tiêu chuẩn vàng về thống kê dân số – không hoàn hảo, nhưng với dữ liệu cung cấp thông tin về tất cả các vùng lân cận ở Vương quốc Anh và dân số của họ. Khi đó, nếu không có tiêu chuẩn đó, việc hiệu chỉnh các nguồn dữ liệu khác và đảm bảo sẽ khó khăn hơn rằng những gì họ đo lường là sự phản ánh chính xác các mô hình và xu hướng xã hội.

Ví dụ, hãy tưởng tượng rằng khi sử dụng cơ sở dữ liệu học sinh quốc gia để ước tính thành phần dân tộc của các khu vực lân cận. Vì nó ghi lại những trường học mà học sinh theo học và thuộc nhóm dân tộc nào, nguồn dữ liệu rất phong phú này đã được sử dụng để chỉ ra rằng sự phân biệt chủng tộc – khả năng các nhóm dân tộc khác nhau chọn trường khác nhau – đang giảm ở Anh. Nó cũng ghi lại nơi những học sinh này sống, do đó đã được sử dụng để tính tỷ lệ phần trăm học sinh theo nhóm dân tộc ở bất kỳ khu vực lân cận nào. Vấn đề hiển nhiên là cách tính này chỉ áp dụng cho những người đang trong độ tuổi đi học. Vấn đề ít rõ ràng hơn là cơ sở dữ liệu học sinh quốc gia không bao gồm thông tin về các trường thu phí. Nói cách khác, dữ liệu được chứa không đầy đủ. Tất nhiên, có nhiều cách để cân nhắc (hay còn gọi là sửa đổi) dữ liệu và liên kết nó với dữ liệu khác để cải thiện độ chính xác. Và ONS khó có thể tiết lộ bất cứ điều gì mà họ biết là gây hiểu lầm. Tuy nhiên, nói chung, chúng ta càng phóng to các tập dữ liệu nhỏ hơn như vậy để khám phá các mô hình và sự khác biệt ở cấp vùng lân cận thì khả năng xảy ra sai sót càng tăng.

Điểm mạnh lớn của tổng điều tra dân số là nó cung cấp dữ liệu chi tiết về mặt địa lý khó có thể sao chép thông qua các nguồn khác (làm như vậy cũng gặp phải vấn đề về bảo vệ dữ liệu cá nhân). Ngược lại, điểm yếu của tổng điều tra dân số là nó không chi tiết về mặt thời gian. Nó cung cấp nhiều dữ liệu chi tiết về mặt địa lý về con người và địa điểm, nhưng thông tin đó không được cập nhật thường xuyên.

Tất nhiên, có thể có cả hai: tổng điều tra dân số truyền thống và một loạt dữ liệu khảo sát và hành chính để dựa vào. Tuy nhiên, điều này sẽ không làm giảm chi phí của cuộc tổng điều tra dân số. Nhưng có những chi phí kinh tế và xã hội khi sử dụng dữ liệu thiếu phạm vi địa lý mà cuộc tổng điều tra dân số cung cấp. Dữ liệu hành chính rất tốt cho việc đo lường các bộ phận dân cư, nhưng vẫn chưa rõ liệu các bộ phận khác nhau đó có kết hợp với nhau đủ tốt để đo lường đầy đủ toàn bộ hay không.

Ngay cả khi họ làm như vậy, dữ liệu đáng tin cậy để sử dụng ở quy mô quốc gia, khu vực hoặc tiểu khu vực sẽ không tự động đưa ra những mô tả chính xác về các điều kiện cụ thể của địa phương và cộng đồng. Chính phủ đã không lập luận một cách thuyết phục về việc bãi bỏ cuộc tổng điều tra dân số.

Phạm Hạnh (dịch)

Nguồn: https://phys.org/news/2024-01-uk-census-alternative-sources.html