Tuyên bố về ý nghĩa thống kê và giá trị P-value
Lần đầu tiên trong lịch sử 177 năm phát triển của mình, Hiệp hội Thống kê Mỹ (ASA) đã lên tiếng đưa ra quan điểm của mình về việc sử dụng giá trị P-value. Gần đây, ASA đã có bài viết với tiêu đề “Tuyên bố về ý nghĩa thống kê và giá trị P-value” gồm sáu nguyên tắc cơ bản sử dụng thích hợp và giải thích giá trị p-value. Mục tiêu của ASA là “làm rõ các khía cạnh trong lĩnh vực thống kê mà thường bị hiểu sai và sử dụng sai trong cộng đồng nghiên cứu”. Một thực hành thống kê tốt là một điều thiết yếu của thực hành khoa học tốt, các giá trị p không bao giờ có thể thay thế được cho luận cứ khoa học.
6 nguyên tắc ASA đưa ra như sau:
1. P-value có thể cho biết dữ kiện thiếu phù hợp với một mô hình thống kê như thế nào?
2. P-value không đo lường xác suất giả thuyết nghiên cứu là đúng, hay đo lường xác suất dữ kiện có được hoàn toàn là do cơ hội ngẫu nhiên.
3. Kết luận khoa học và các quyết định hay chính sách được đưa ra không nên chỉ dựa trên giá trị p-value (mới một mức độ định sẵn cụ thể thường là 0,05).
4. Suy luận thích hợp đòi hỏi báo cáo phải đầy đủ và rõ ràng.
5. Giá trị p-value hay ý nghĩa thống kê không đo lường sự quan trọng của kết quả.
6. Bản thân giá trị p-value không cho một đo lường tốt về bằng chứng đối với một mô hình hoặc một giả thuyết.
Con đường dẫn tới hiểu lầm:
Trong bài báo “Các kiểm định thống kê, giá trị p-value, Khoảng tin cậy, và khả năng: Hướng dẫn đến sự hiểu nhầm”, Sander Greenland và các tác giả đã đưa ra gồm ít nhất 14 vấn đề bị hiểu sai liên quan đến p-value, 4 vấn đề liên quan đến việc so sánh p-value và dự đoán, 5 vấn đề liên quan đến khoảng tin cậy, và 2 hiểu lầm thường gặp liên quan đến tính toán năng lực nghiên cứu. Những khuyến nghị dưới đây nhằm làm giảm những tác hại trong thực hành thống kê hiện tại:
1. Diễn giải chính xác và cẩn thận các kiểm định thống kê đòi hỏi phải đánh giá ước lượng mức độ ảnh hưởng và khoảng tin cậy, cũng như giá trị chính xác của p-value.
2. Việc diễn giải một cách cẩn thận đòi hỏi các đánh giá phê bình về các giả định và quy ước được sử dụng cho phân tích thống kê – không chỉ những giả định thống kê thông thường, mà cả những giả định ẩn phía sau về phương pháp tính toán ra các kết quả và lựa chọn để trình bày.
3. Việc nói kết quả không có ý nghĩa thống kê ủng hộ giả thuyết được kiểm định đơn giản là sai.
4. Để đánh giá chính xác số thống kê của nhiều nghiên cứu đòi hỏi phân tích gộp…
5. Bất kỳ ý kiến nào được đưa ra về một xác suất, mức độ chắc chắn, hay các đặc tính tương tự về một giả thuyết không thể chỉ bắt nguồn từ các phương pháp thống kê.
6. Tất cả các phương pháp thống kê đều đòi hỏi rất nhiều giả định về thứ tự của hàng loạt các bước đưa đến kết quả được trình bày – không chỉ từ việc thu thập dữ liệu mà cả trong việc lựa chọn phương pháp phân tích… các báo cáo khoa học cần mô tả chi tiết đầy đủ các bước dẫn đến những số thống kê được đưa ra…
Lan Phương (tổng hợp và lược dịch)
Nguồn: http://www.amstat.org/newsroom/pressreleases/P-ValueStatement.pdf và http://link.springer.com/article/10.1007/s10654-016-0149-3