Bạn sẽ nghĩ điều gì có khả năng kết thúc mọi sự sống trên Trái đất nhất: một cuộc tấn công của sao băng, biến đổi khí hậu hay một vụ nổ mặt trời? Một phương pháp thống kê mới có thể giúp phân tích chính xác rủi ro của các tình huống xấu nhất (hoặc tốt nhất). Các nhà khoa học đã công bố một phương pháp mới để đưa ra thông tin về các sự kiện hiếm gặp, nhưng có hậu quả nặng nề ví dụ như đại dịch. Khám phá này giúp các nhà thống kê sử dụng toán học để tìm ra hình dạng phân phối cơ bản của một tập hợp dữ liệu. Điều này có thể giúp tất cả mọi người, từ các nhà đầu tư đến các quan chức chính phủ nhằm đưa ra quyết định sáng suốt đặc biệt hữu ích khi điều kiện thiếu dữ liệu thưa thớt, như đối với các trận động đất lớn.
Nhà sinh học toán học Joel Cohen, đồng tác giả của một nghiên cứu mới được công bố vào tháng 11 cho biết: “Mặc dù theo định nghĩa chúng hiếm xảy ra, nhưng những sự kiện như vậy vẫn xảy ra và quan trọng; Chúng tôi hy vọng đây là một bộ công cụ hữu ích để hiểu và tính toán những rủi ro này tốt hơn” – Kỷ yếu của Viện Hàn lâm Khoa học Quốc gia.
Thay đổi các câu hỏi
Thống kê là khoa học sử dụng dữ liệu hạn chế để tìm hiểu về thế giới và tương lai. Các câu hỏi của nó bao gồm từ “Khi nào là thời điểm tốt nhất trong năm để phun thuốc trừ sâu trên một cánh đồng hoa màu?” đến “Khả năng một đại dịch toàn cầu xảy ra làm xã hội giãn cách rộng lớn như thế nào?”
Có tuổi đời một thế kỷ, lý thuyết thống kê về các sự kiện hiếm gặp nhưng cực đoan là một lĩnh vực tương đối mới và các nhà khoa học vẫn đang lập danh mục phương pháp tốt nhất để thu thập các loại dữ liệu khác nhau. Các phương pháp tính toán có thể ảnh hưởng đáng kể đến kết luận, vì vậy các nhà nghiên cứu phải điều chỉnh cách tiếp cận dữ liệu cẩn thận.
Hai công cụ mạnh mẽ trong thống kê là giá trị trung bình và phương sai. Có thể bạn đã quen với giá trị trung bình. Nếu một học sinh đạt điểm 80 trong một bài kiểm tra và một học sinh đạt 82, thì điểm trung bình của họ là 81. Mặt khác, phương sai đo lường mức độ phổ biến của những điểm số đó. Bạn sẽ nhận được điểm trung bình như nhau nếu một học sinh đạt 62 điểm và người khác đạt 100 điểm, nhưng tác động lên tổng thể của lớp học sẽ rất khác.
Trong hầu hết các tình huống, cả giá trị trung bình và phương sai đều là những con số hữu hạn, giống như tình huống trên. Nhưng mọi thứ sẽ khác trong trường hợp các sự kiện rất hiếm nhưng cực đoan xảy ra. Trong hầu hết các năm, không có hoạt động nào từ bề mặt mặt trời đủ lớn để đốt cháy tất cả các thiết bị điện tử của Trái đất. Nhưng nếu điều đó xảy ra trong năm nay, hậu quả có thể rất thảm khốc. Tương tự, mặc dù phần lớn các công ty công nghệ khởi nghiệp thất bại sau thời gian rầm rộ ban đầu. Tuy nhiên các công ty như Google hoặc Facebook đôi khi cũng xuất hiện.
Cohen nói: “Có một mục mà các sự kiện lớn rất hiếm khi xảy ra, nhưng thường đủ để thúc đẩy giá trị trung bình và / hoặc phương sai đến vô cùng.
Những tình huống này, giá trị trung bình và phương sai tiệm cận đến vô cùng khi ngày càng nhiều dữ liệu được thu thập, yêu cầu các phương pháp riêng. Hiểu được rủi ro của các sự kiện này (theo cách nói thống kê là các sự kiện có “phân phối nhiều đuôi”) là vấn đề quan trọng. Các cơ quan chính phủ cần biết họ nên đầu tư bao nhiêu công sức và tiền bạc cho việc chuẩn bị cho các thiên tai, các nhà đầu tư muốn biết cách để tối đa hóa lợi nhuận.
Cohen và các đồng nghiệp của ông đã xem xét một phương pháp toán học để tính toán rủi ro, chia phương sai ở giữa, tính phương sai dưới mức trung bình và trên mức trung bình, có thể cung cấp cho bạn thêm thông tin về rủi ro tăng và giảm. Ví dụ: một công ty công nghệ có nhiều khả năng thất bại (kết thúc dưới mức trung bình) hơn là thành công (kết thúc trên mức trung bình). Đây là điều mà một nhà đầu tư muốn biết khi cân nhắc có nên đầu tư hay không. Tuy nhiên, phương pháp này không được kiểm tra để tìm các phân phối của các sự kiện có xác suất thấp, tác động rất cao với giá trị trung bình và phương sai vô hạn.
Tiến hành thử nghiệm, các nhà khoa học nhận thấy cách để làm việc với những con số này, được gọi là phương sai bán phần, không mang lại nhiều thông tin. Tuy nhiên, họ đã tìm ra những cách khác. Ví dụ: Họ có thể trích xuất thông tin hữu ích bằng cách tính toán tỷ lệ giữa log của giá trị trung bình và log của bán phương sai. Cohen nói: “Nếu không có ghi chép, bạn sẽ nhận được ít thông tin hữu ích hơn. “Nhưng với ghi chép, hành vi giới hạn đối với các mẫu dữ liệu lớn sẽ cung cấp thông tin về hình dạng của phân phối cơ bản. Đây là điều rất hữu ích.” Những thông tin này có thể giúp đưa ra quyết định.
Các nhà nghiên cứu hy vọng phương pháp mới sẽ đặt nền tảng cho việc khám phá rủi ro. Cohen cho biết: “Chúng tôi cho rằng phương pháp này có thể ứng dụng thực tế cho toán học tài chính, kinh tế nông nghiệp và thậm chí là khả năng xảy ra dịch bệnh. Tuy nhiên, vì nó quá mới nên chúng tôi thậm chí không chắc những lĩnh vực hữu ích nhất có thể là gì. “Chúng ta chỉ mới mở ra thế giới này. Nó chỉ mới bắt đầu.”
Phạm Hạnh (dịch)
Nguồn: https://phys.org/news/2021-11-method-low-probability-high-risk-events-earthquakes.html