Thống kê không chỉ là trò chơi về các con số

Thống kê không chỉ là một trò chơi về các con số – nó là nền tảng của tất cả các ngành khoa học.

Chúng ta đều quen thuộc với nhiều ví dụ minh họa về thống kê trong cuộc sống hàng ngày: thống kê về thể thao, thời tiết, dân số, thị trường chứng khoán… các loại có thể xuất hiện ở cột “thử tài cùng các con số” trong tạp chí The Age và The Sydney Morning Herald.

Đặc trưng chủ yếu của thống kê là dữ liệu: thiết kế cách thu thập, tổng hợp, mô tả, trình bày và rút ra kết luận từ dữ liệu. Các khái niệm chủ yếu là độ biến thiên và sự không chắc chắn, nhằm hợp lý hóa sự đa dạng của các dữ liệu. Tôi sẽ cung cấp một phân tích đơn giản chia thống kê thành ba loại chính.

Loại thứ nhất là sự kiện thống kê. Chúng thường rất thú vị, hoặc được so với sự kiện tương tự ở những thời gian hoặc không gian khác nhau. Chúng thường được xem là số liệu, nhưng trên thực tế, chúng là sự tổng hợp các số liệu.

Tỷ lệ người Úc từ 15 tuổi trở lên chưa bao giờ kết hôn trong năm 2001 là bao nhiêu? Câu trả lời là 32%. Đằng sau con số 32% là cuộc điều tra dân số tại Úc năm 2001. Là một bản tóm tắt các số liệu điều tra dân số, nó không thể hiện sự không chắc chắn thống kê.

Phức tạp hơn là dữ liệu được thu thập trong mẫu điều tra dân số dựa trên các cá thể được lựa chọn ngẫu nhiên. Do độ biến thiên trong phương trình, các mẫu khác nhau nhìn chung sẽ cho kết quả khác nhau.

Dữ liệu điều tra mẫu thường được tổng hợp cụ thể như tỷ lệ, tỷ lệ phần trăm hoặc số bình quân, và các kết quả được trình bày là những suy luận liên quan tới tình hình dân số. Đó sẽ là các suy luận không chắc chắn, do độ biến thiên của mẫu (“lỗi”) và các loại lỗi khác.

Cuộc điều tra quốc gia về sức khỏe tâm lý và an sinh được thực hiện bởi Tổng cục Thống kê Úc (ABS) nhận thấy ước tính 3,2 triệu người dân (20% dân số trong độ tuổi từ 16 đến 85) có sự rối loạn tâm lý trong khoảng thời gian 12 tháng trước điều tra. (Việc trình bày con số ước tính và cách giải thích kết luận trên nằm ngoài phạm vi của bài viết này.)

Chúng ta gọi thống kê điều tra mẫu này là loại thứ hai

Vai trò của thống kê trong lĩnh vực sức khỏe

Chúng ta có thể bắt đầu với những sự kiện tóm tắt liên quan đến tỷ lệ tử vong và tỷ lệ mắc bệnh, cho thấy chúng ta ở đâu, cũng như là mở đầu cho nơi mà chúng ta hướng đến. Chúng ta có thể chuyển sang các cuộc điều tra để chỉ ra các thông tin chi tiết hơn về các chủ đề cụ thể hơn là có từ việc thu thập dữ liệu thường xuyên.

Cuộc điều tra sức khỏe tâm lý được đề cập ở trên là một ví dụ. Dịch tễ học có mối liên quan chặt chẽ đến thống kê sinh học trong việc tìm hiểu về các mô hình và nguyên nhân của bệnh tật, và ban hành các chính sách bằng cách nhận dạng các yếu tố rủi ro.

Thống kê sinh vật học được sử dụng trong thiết kế, thực hiện và phân tích các thử nghiệm lâm sàng để đánh giá hiệu quả của vắc-xin, thuốc, máy móc thiết bị, phương pháp điều trị hay các biện pháp can thiệp.

Nó cũng được sử dụng rộng rãi trong nghiên cứu y sinh học tiền lâm sàng, nơi phân tích tế bào hay sinh vật mẫu, trong các nghiên cứu cần thiết trước khi một loại thuốc được thử nghiệm lâm sàng trên con người và hơn thế nữa.

Chất lượng công nghiệp

Vai trò của thống kê trong ngành công nghiệp tri thức, hàng hoá và dịch vụ chất lượng cao, các khía cạnh của nền kinh tế mà nhiều người (trong đó có tôi) muốn nhìn thấy được mở rộng tại Úc trong thập kỷ tới là gì?

Các phương pháp thống kê được sử dụng rộng rãi lần đầu trong ngành công nghiệp sản xuất từ những năm 1930, xây dựng trên công việc tiên phong của Walter Shewhart trong những năm 1920, người được biết đến như là cha đẻ của kiểm soát chất lượng thống kê.

Các hoạt động này mở ra nhanh chóng sau Chiến tranh Thế giới thứ hai, đặc biệt là Nhật Bản, nơi mà các kỹ sư và thống kê viên người Mỹ tham gia cùng các đối tác người Nhật tạo nên sự đóng góp quan trọng đến danh tiếng của Nhật Bản về các sản phẩm sáng tạo, chất lượng cao.

Những phát triển này đã mở rộng vai trò của thống kê, vượt ra ngoài phạm vi thống kê. Tư duy thống kê đi vào tâm trí của cả quản lý lẫn người lao động, thông qua các khái niệm như vòng tròn chất lượng. Xác định vấn đề, thu thập dữ liệu và phân tích thống kê cơ bản trở thành khía cạnh quan trọng trong công việc.

Trong các thập kỷ từ những năm 1950 đến những năm 1960, giá trị của tư duy thống kê trong tất cả các ngành công nghiệp đã được thừa nhận rộng rãi.

Những phát triển tiêu chuẩn như Total Quality Management, Six Sigma và hàng loạt các tiêu chuẩn của Tổ chức Tiêu chuẩn hóa Quốc tế (ISO) được biết đến như ISO 9000 đã góp phần làm nên sự nhận thức gần như phổ quát về các giá trị của thống kê trong việc “định nghĩa, thiết lập, và duy trì một hệ thống đảm bảo chất lượng hiệu quả cho các ngành công nghiệp sản xuất và dịch vụ” và cải thiện chất lượng sản phẩm và dịch vụ.

Ngay từ những ngày đầu tiên, trong ngành công nghiệp sản xuất các phương pháp đã có hiệu quả, với những thay đổi thích hợp, nhưng trong ngành công nghiệp dịch vụ, nó lại được hiểu chậm hơn.

Một điều chắc chắn.

Trong một hoặc nhiều cách thức mà tôi đã mô tả, thống kê đã tham gia gần như mọi khía cạnh của đời sống con người. Chúng ta có thể sử dụng nó cho việc lập kế hoạch tốt hơn, cung cấp hiệu quả hơn các dịch vụ, và tăng năng suất sản phẩm.

Giá trị của thống kê chỉ bị giới hạn bởi sự thiếu nhận thức và sự thiếu hụt trầm trọng các thống kê viên được đào tạo bài bản. Điều này có thể được sửa chữa.

Cũng như rất khó để định lượng được lợi ích của việc có một lực lượng lao động có đầy đủ kiến thức về ngôn ngữ viết và nói, vì vậy rất khó để định lượng được lợi ích của việc có một lực lượng lao động có thể truyền đạt đầy đủ sự hiểu biết về độ biến thiên và sự không chắc chắn.

John Henstridge, giáo sư Đại học Tây Úc: “Terry đã minh họa rõ cách mà thống kê thâm nhập vào hầu hết các lĩnh vực khoa học, công nghiệp và bộ máy chính quyền để cải thiện tình hình nước Úc. Tôi phải đồng ý với điều này – mặc dù tôi đã trải qua nhiều thập kỷ làm việc với vai trò là một nhà thống kê, nhưng tôi vẫn ngạc nhiên về lợi ích của các công cụ và cách áp dụng rộng rãi của nó.

Nó thực sự như một con dao nhíp quân đội Thụy Sĩ sắc bén.

Terry đã trình bày các lý do để có thể lạc quan về số liệu thống kê và những gì nó có thể góp phần vào nguyện vọng của chúng tôi đối với Australia. Với một hồ sơ theo dõi, rất khó để tưởng tượng bất cứ điều gì khác. Nhưng số liệu thống kê đang đối mặt với những thách thức tại Úc.

Với trường hợp ngoại lệ đáng chú ý, như tất cả các ngành khoa học toán học, lĩnh vực  thống kê đang bị thu hẹp trong các trường đại học tại Úc. Điều này một phần là do việc giảm tiêu chuẩn của toán học tại các trường trung học. Thống kê cũng bị thách thức bởi sự công nhận thiếu rõ ràng, một phần là do thống kê đã hòa lẫn vào bản chất các ứng dụng mà Terry đã nêu bật.

Mọi người trong nhiều khu vực không nhận ra rằng các nhà thống kê đã phát triển các công cụ mà họ cần, và thường nhìn nhận thống kê thông qua cách nó được sử dụng để được giảng dạy. Các nhà thống kê chia sẻ một vài trách nhiệm trong phương pháp giảng dạy nghèo nàn thường xuyên của họ.

Bỏ qua những mối liên quan này, tôi vẫn có cái nhìn lạc quan như Terry. Một trong những lý do là các nhà thống kê tạo ra một cộng đồng những người đam mê tìm hiểu thế giới của chúng ta thông qua các số liệu. Đó chính xác là những gì mà nước Úc cần có để đưa ra những quyết định đúng đắn”

David Warton, Phó giáo sư tại Đại học New South Wales: “Tại trường đại học, tôi đã lên kế hoạch chuyên về sinh thái học, nhưng tôi đã chuyển sang một đề tài mà tôi thấy thú vị hơn – thống kê! Một nhà sinh thái học có thể dành toàn bộ sự nghiệp của mình chỉ nghiên cứu về thực vật, hải cẩu, động vật không xương sống, ếch nhái, chim chóc hay vi khuẩn, nhưng tôi đã nghiên cứu về tất cả những điều này và hơn thế nữa (mặc dù chủ yếu qua mạng máy tính).

Nghiên cứu thống kê có một vai trò quan trọng giúp các nhà sinh thái tìm ra cấu trúc bề mặt của rất nhiều sự không chắc chắn. Nó có vai trò tương tự như một ngành khoa học khả dụng trong tất cả các ngành tập trung trong loạt bài này.

Trong khi thống kê là một lựa chọn nghề nghiệp xứng đáng, thì có một thách thức là làm thế nào để đảm bảo sinh viên có đủ năng lực lựa chọn ngành này – tiếp tục nâng cao năng lực và chuyên môn để đáp ứng các nhu cầu của khoa học và công nghiệp, và các thách thức của thời đại kỹ thuật số như dữ liệu lớn và nghiên cứu hệ thống.

Tuy nhiên các quyết định ngân sách gần đây là một mối đe dọa trực tiếp, cùng với những rủi ro dẫn đến việc cấp bằng nghiên cứu sinh về thống kê này sẽ trở thành ngoài tầm với cho nhiều người, và việc cắt giảm nguồn tuyển dụng sinh viên mới tốt nghiệp đại học tại CSIRO và ABS.

Thách thức thứ hai là cần cải thiện tiêu chuẩn về trình độ thống kê của các nhà khoa học, nhà báo, bác sĩ, bệnh nhân và cộng đồng nói chung, như vậy tất cả có thể đưa ra quyết định khi đối mặt với sự không chắc chắn.

Vai trò cao hơn của thống kê trong chương trình giảng dạy toán học quốc gia có thể giúp cải thiện trình độ thống kê, cung cấp lực lượng giáo viên có đủ trình độ và hỗ trợ để thực hiện thay đổi chương trình giảng dạy một cách có hiệu quả hơn.

Các trường đại học cũng có thể giúp bằng cách đảm bảo đội ngũ làm việc toàn thời về các dịch vụ tư vấn thống kê, nguồn tài nguyên vô giá cho cộng đồng nghiên cứu của họ.

Nhung Phạm (dịch)

Nguồn: http://phys.org/news/2014-07-statistics-game-underpins-sciences.html