Sử dụng thống kê để lập mô hình, dự đoán và giải thích hiện tượng

“Nếu bạn là một người đàn ông trên tàu Titanic, bạn sẽ chạy về phía nào của con tàu để có thể biến nó thành một chiếc xuồng cứu sinh và có cơ hội sống sót”?

Theo phân tích dữ liệu của giáo sư Michael Friendly, Khoa Tâm lý học Đại học York, những chiếc xuồng cứu sinh được phóng ra từ các bên khác nhau của con tàu chìm sẽ cho thấy những mô hình khác nhau nói lên tỷ lệ nam giới trên tàu. Phía bên mạn trái, những chiếc xuống cứu sinh với trọng tải nhẹ sẽ chứa số lượng lớn hành khách là nam giới và thuyền viên. Trong khi đó, phía mạn phải, các xuồng cứu sinh được chuẩn bị đầy đủ và chứa gần như hoàn toàn phụ nữ và trẻ em.

Việc tìm kiếm đại diện đồ họa phù hợp cho dữ liệu đóng vai trò quan trọng trong việc khám phá khoa học. Điều này đã được giáo sư Friendly phát biểu trong lịch sử phân tích đồ họa đối với nghiên cứu khoa học tại Hội nghị thường niên về Khoa học tiến bộ Boston ngày 16/02/2018. Đồ họa chi tiết đóng vai trò quan trọng trong việc giúp các nhà khoa học tạo ra những khám phá mới và giải thích chúng cho công chúng.

Nền tảng của đồ họa khoa học đã được các nhà thống kê như Andre Michel Guerry đặt ra vào đầu thế kỷ 19. Ông đã sử dụng chúng để phân tích dữ liệu toàn diện về “thống kê đạo đức (tỷ lệ tội phạm, tự tử, trình độ học vấn…). Nhiều nhà khoa học khác cũng đã sử dụng và điều chỉnh việc sử dụng đồ họa khoa học. Một trong những dẫn chứng nổi tiếng nhất là công trình của John Snow, người đã chứng minh được mối liên hệ giữa bệnh tả và nguồn nước bị ô nhiềm bằng cách lập bản đồ tử vong ở London và những năm 1860. Ông đã truy tìm nguồn gốc của căn bệnh, xử lý và dịch bệnh đã dừng lại trong vòng một vài ngày.

150 năm sau, những thách thức của việc phân tích dữ liệu càng trở lên phức tạp hơn, các nhà nghiên cứu khoa học phải dựa vào các mô hình đồ họa phức tạp hơn, như đồ thị đa chiều. Công việc của giáo sư Friendly đã giúp phát triển các phương pháp đồ họa cho dữ liệu phân loại, (dữ liệu rơi vào một nhóm chuyên biệt rời rạc, như giới tính, tình trạng hôn nhân…) và giúp phát triển lịch sử đồ họa thống kê thế giới.

Phạm Hạnh (dịch)

Nguồn: https://www.sciencedaily.com/releases/2008/02/080215082756.htm