Phương pháp để hiểu cấu trúc thống kê ẩn trong dữ liệu môi trường

Huang Huang (trái) và Ying Sun đã phát triển một cách thức để hiểu các đặc tính hiệp phương sai không gian-thời gian của một tập dữ liệu, điều này sẽ giúp hiểu được dữ liệu về môi trường. Nguồn: KAUST

Dự báo khí hậu và thời tiết dựa trên các mô hình thống kê có thể nắm bắt được sự biến đổi tại một địa điểm theo thời gian cũng như mối quan hệ với các vị trí địa lý khác. Đôi khi các điều kiện trong tương lai tại một địa điểm có thể được dự đoán từ các điều kiện hiện tại tại một địa điểm khác, trong khi ở các trường hợp khác có thể không có sự tương quan như vậy. Giả thiết liệu rằng hai vị trí có ‘biến số’ theo cách này hay cách khác có thể có ý nghĩa sâu sắc đối với tính chính xác của mô hình thống kê và do đó việc lựa chọn hiệp phương sai không gian-thời gian là rất quan trọng.

Ying Sun và sinh viên của cô, Huang Huang đến từ trường Đại học Khoa học và Công nghệ King Abdullah (KAUST) đã phát triển một phương pháp để hiểu các thuộc tính hiệp phương sai không gian-thời gian của một tập dữ liệu, đơn giản hóa một bước mô hình quan trọng mà trước đây đòi hỏi phải có sự phân tích dữ liệu thăm dò thường xuyên.

“Chúng tôi đề xuất một cách đơn giản và thuận tiện để hình dung các thuộc tính của cấu trúc hiệp phương sai trong dữ liệu, điều này sẽ giúp các học viên lựa chọn các mô hình thống kê thích hợp cho các hiệp phương sai”, Sun nói. “Đặc biệt, phương pháp này hữu ích cho dữ liệu được quan sát thưa thớt trong không gian và dày đặc trong thời gian, điều này thường xảy ra đối với các trạm quan sát thời tiết.”

Sun và Huang đã xem xét hai loại chính của sự đối xứng hiệp phương sai và tính tách biệt. Sự đối xứng ngụ ý rằng các quy trình về không gian và thời gian có thể đảo ngược được trong thời gian, trong khi sự tách biệt chỉ ra rằng tương quan trong thời gian không tương tác với không gian đó.

Sun nói: “Giả sử có một mô hình hoàn toàn đối xứng hoặc một hiệp phương sai được chia tách dẫn đến đơn giản hơn và tính toán nhanh hơn nhiều. Tuy nhiên, giả định mô hình này có thể bị vi phạm trong nhiều ứng dụng thực tế, dẫn đến sự ước lượng và dự đoán ít chính xác hơn.”

Huang và Sun đã sử dụng phương pháp phân tích dữ liệu chức năng để xây dựng các hàm kiểm tra từ các hiệp phương sai trong dữ liệu chuỗi thời gian giữa các cặp vị trí . Các chức năng kiểm tra này có hiệu quả tóm tắt các tính chất của khả năng chia tách hoặc đối xứng và có thể được hiển thị như các ô vuông cho thấy mức độ không phân ly hoặc không đối xứng.

Huang cho biết: “Chúng tôi áp dụng cách tiếp cận này để quan sát khí tượng và dữ liệu mô phỏng thời tiết từ một số mô hình khí hậu thông thường. Trong các ví dụ được báo cáo cho một khu vực nghiên cứu ở Bắc Đại Tây Dương, phương pháp này cho thấy tốc độ gió và nhiệt độ bề mặt có các cấu trúc hiệp phương sai khác nhau trong các mùa khác nhau.”

Các nhà nghiên cứu lưu ý rằng hiệu suất tính toán có thể được cải thiện cho một số lượng lớn các trạm bằng cách phân chia vấn đề thành các tiểu vùng. Hình ảnh này có thể được tính tương đối nhanh chóng cho một số trạm quan trắc. Tuy nhiên, phương pháp này cung cấp một công cụ có giá trị rất lớn cho việc nghiên cứu của học viên.

Nhung Phạm (dịch)

Nguồn: https://phys.org/news/2018-01-method-visualize-hidden-statistical-environmental.html