Báo Người lao động cho biết 9 ngày đầu năm Nhâm Thìn (2012) có 326 người chết vì tai nạn giao thông. Đối với nhà báo, chắc phải ngạc nhiên, nên con số này mới xuất hiện trong một bản tin của báo. Nhưng đối với những người bình tĩnh, vấn đề đặt ra là con số này có làm chúng ta ngạc nhiên không?
Ngạc nhiên hay không có thể trả lời qua lí giải thống kê: Giả thuyết đặt ra là xu hướng tử vong vì tai nạn giao thông trong 9 ngày đầu năm Nhâm Thìn tương đương với số tử vong trung bình hàng năm. Để kiểm định giả thuyết trên, chúng ta cần xem xét 2 nguồn dữ liệu: Con số tử vong trung bình cả năm, và con số tử vong “quan sát” được trong 9 ngày đầu năm.
Theo báo chí, mỗi năm có trên 14000 vụ tử vong vì tai nạn giao thông ở Việt Nam. Như vậy, tính trung bình, mỗi ngày có 14000/365 xấp xỉ 38 người tử vong.
Chúng ta đã có dữ liệu đầu: trong 9 ngày đầu năm, chúng ta quan sát được 326 người tử vong.
Vấn đề đặt ra là số tử vong trong 9 ngày đầu năm có thật sự đáng ngạc nhiên. Nếu tỉ lệ tử vong trung bình cả năm là 38 người/ngày, thì trong 9 ngày chúng ta kì vọng có 9 x 38 = 342 vụ. Nhưng trong thực tế, chúng ta quan sát 326 vụ, tức thấp hơn trung bình. Do đó, con số 326 vụ tử vong không có gì đáng ngạc nhiên trong tình trạng tai nạn giao thông hiện nay.
Chúng ta có thể lượng hóa sự ngạc nhiên. Gọi số tử vong trung bình cả năm là m0, và số tử vong trung bình 9 ngày đầu năm là m, có 2 giả thuyết thống kê có thể phát biểu như sau:
Ho: m = m0
H1: m ≠ m0
Thông thường, có thể giả định rằng số tử vong trung bình mỗi ngày tuân theo quy luật phân phối Poisson. Luật phân phối Poisson phát biểu rằng xác suất quan sát x vụ tử vong với tỉ suất trung bình m là:
Chúng ta có thể tính P(x ≥ 326) bằng hàm poisson.test trong R để kiểm định giả thuyết trên:
poisson.test(x=326, T=9, r=14000/365)
Trong hàm trên, x = 326 là số vụ tử vong, T = 9 là thời gian theo dõi 9 ngày đầu năm, và r = 14000/365 là số vụ tử vong trung bình mỗi ngày tính toàn năm. Kết quả dưới đây cho thấy trị số P = 0.319. Nói cách khác, xác suất có 326 ca tử vong hoặc cao hơn trong 9 ngày đầu năm là gần 32%, một lần nữa khẳng định chúng ta không ngạc nhiên.
> poisson.test(x=326, T=9, r=14000/365)
Exact Poisson test data: 326 time base: 9 number of events = 326, time base = 9, p-value = 0.3193 alternative hypothesis: true event rate is not equal to 38.35616 95 percent confidence interval: 32.39649 40.37553 sample estimates: event rate 36.22222 |
Tài liệu tham khảo:
(1)http://www.baomoi.com/Tai-nan-giao-thong-o-Viet-Nam-Moi-nam-hon-14000-nguoi-thiet-mang/82/6238844.epi
(2)http://nld.com.vn/201201301141118p0c1002/9-ngay-tet-326-nguoi-chet-vi-tai-nan-giao-thong.htm
L.P (st)