Câu chuyện “bơi ngược dòng” cùng Thống kê

Jenny Chen gặp phải một vấn đề về bơi lội.

Từ một vận động viên thi đấu bơi lội lúc lên 5 tuổi, Jenny nhận ra: Giờ đây, khi đã bước sang tuổi 13, cô bé rất khó khăn để có thể cải thiện thành tích và vượt qua các đồng đội của mình. “Tình trạng trì trệ va vào tôi như một đoàn tàu chở hàng và khiến tôi không khỏi nghi ngờ về con đường dẫn đến mục tiêu của mình đang vô cùng mù mịt. Tôi bắt đầu lo sợ mình sẽ mất hút trong cuộc đua, thay vì tận hưởng đam mê bơi lội và mọi thứ từng đốt cháy ngọn lửa trong tôi bắt đầu chống lại tôi”.

Jenny bắt đầu tìm kiếm một giải pháp cho vấn đề của mình và thật bất ngờ, việc tìm kiếm đã dẫn cô bé đến với một tình yêu mới – Thống kê. Cô bé không phải là người xa lạ với các số liệu thống kê bởi cha cô là một thành viên có thâm niên của Hiệp hội Thống kê Hoa Kỳ (ASA), nhưng với cô bé, những con số thống kê chưa bao giờ là chủ đề yêu thích của mình.

Tuy nhiên, sau khi tham gia khóa học Thống kê cơ bản ở trường học, Jenny quyết định sẽ tìm ra câu trả lời cho vấn đề của mình bằng cách sử dụng mô hình thống kê. Jenny  cho biết có thể có sự khác biệt về chủng tộc liên quan đến các yếu tố về sức mạnh, sức chịu đựng và kích thước. Điều này đặt ra một câu hỏi khoa học trong tâm trí của cô bé: Thực sự có hay không sự khác biệt về chủng tộc trong tốc độ bơi.

Jenny sử dụng dữ liệu từ Hiệp hội Bơi lội Hoa Kỳ và các đồng đội trong câu lạc bộ bơi lội của mình, từ 7 tuổi đến 17 tuổi. Cô bé thực hiện phân tích dữ liệu bằng phần mềm R và một thư viện lưới (lattice library) để kiểm tra thời gian bơi và tuổi tác. Cô bé xây dựng một mô hình các hiệu ứng hỗn hợp phi tuyến tính để tạo ra các dự đoán về thời gian bơi lội của người châu Á và không phải châu Á so với lứa tuổi của những người này.

Sau khi xem xét các dự báo, Jenny phát hiện: Giai đoạn dậy thì mạnh mẽ (khoảng 12 tuổi) ảnh hưởng đến thời gian bơi của cả hai nhóm người, trong đó có sự suy giảm về khả năng bơi lội ở những người châu Á, trong khi những người không phải châu Á lại bơi nhanh hơn. Vậy là Jenny đã tìm ra bằng chứng để chứng minh những phát hiện của mình trong nghiên cứu về ảnh hưởng khác nhau của tuổi dậy thì đến các nhóm sắc tộc. Jenny cho biết: “Vì những vận động viên bơi lội không phải người châu Á thường sớm trở nên mạnh mẽ và cao hơn so với những vận động viên người châu Á, nên rõ ràng những lợi thế này sẽ giúp ích cho họ rất nhiều”.

Không chỉ tìm ra câu trả lời, Jenny còn trình bày những phát hiện của mình tại Hội nghị Thống kê Chung của ASA năm 2016, với hình thức trình bày bằng poster chuyên nghiệp có tựa đề “Liệu có sự khác biệt chủng tộc về tốc độ bơi? Mô hình các hiệu ứng hỗn hợp gậy khúc côn cầu về bơi lội phi tuyến tính”.

“Trong bài thuyết trình, tôi đã gặp một số giáo sư gần nơi tôi sinh sống. Tôi đã gặp một số huấn luyện viên bơi lội có cùng thắc mắc về sự khác biệt chủng tộc trong bơi lội!”

Jenny Chen đứng trước poster trình bày tại Hội thảo

Thông qua những kinh nghiệm này, Jenny đã “học được cộng đồng thống kê là nơi tôi muốn gia nhập trong tương lai” và dự định sẽ nghiên cứu về thống kê sinh học hoặc thẩm định rủi ro ở trường đại học. Tất nhiên, cô bé vẫn tiếp tục bơi lội. Năm 2016, Jenny là đội trưởng đội bơi East Varsity cho giải bơi lội tiểu bang của Hiệp hội các vận động viên trung học North Carolina.

Giải quyết được những rắc rối của bản thân trong đam mê bơi lội đã dẫn dắt Jenny để cô bé khám phá ra tình yêu với Thống kê. Nếu bạn cũng đang tò mò về mọi thứ, hãy để Thống kê chạm vào những câu hỏi đó và kéo não bộ của bạn vào hành trình khám phá những điều thú vị.

Đậu Trang (dịch)

Nguồn: http://thisisstatistics.org/swimming-against-the-tide-with-statistics/